标签:火山引擎视频云

火山引擎Q-Insight结合强化学习,推动图像质量评估与多模态大模型在视频云领域的深度发展

随着生成式人工智能与多模态大模型的快速发展,AI 视觉创作正迎来前所未有的生产力爆发。然而,如何评估机器生成的画质是否符合人眼审美,成为了一个亟待解决的问题。北京大学与火山引擎多媒体实验室联合提出了一种基于强化学习训练的多模态大模型图像画质理解方案 Q-Insight,为这一问题提供了创新性的解决方案。 Q-Insight 的核心理念 Q-Insight 不再简单地依赖于对人眼评分的拟合,而是将评分视为一种引导信号,促使模型深入思考图像质量的本质原因。这种方法不仅提升了模型的准确性,还增强了其泛化推理能力,使得 Q-I...