数字人直播技术近年来备受关注,而AI数字人能否真正取代真人主播一直是业界讨论的焦点。近日,罗永浩数字人在百度直播中的首次亮相,不仅实现了近7小时连续直播,更创下了1300万人次观看、GMV突破5500万的佳绩。这一成绩不仅超越了以往AI数字人的记录,甚至超过了真人主播的表现。
在直播间中,观众对数字人的逼真表现感到惊讶,“这是真的还是假的”成为弹幕中最常见的评论。这表明,百度的AI数字人技术已经达到了一个新的高度,几乎可以与真人媲美。此次直播不仅是技术的一次展示,更是百度AI在商业环境中的实战演练。
百度的数字人技术采用了多模协同的方式,将语言大模型置于核心位置,统筹指挥语音、视觉等多个模块,从而实现了一场几乎以假乱真的演出。相比传统的数字人技术,百度的技术方案通过剧本驱动、多模规划与深度思考、动态决策实时交互、文本自控语音合成以及高一致性超拟真数字人长视频生成等五项创新技术,确保了数字人在“神、形、音、容、话”上的高度统一。
具体来说,百度的“剧本”模型扮演了总指挥的角色,输入包含商品信息、历史视频、主播人设要求等多种信息,生成具体的视觉和语音要求,确保、语气和表情的高度一致性。此外,动态决策系统使得数字人能够根据评论区的问题进行智能分析,并选择合适的时机和策略进行回答,进一步提升了互动的真实感。
在双人直播场景中,百度引入了“对话上下文解码器”,结合历史对话信息进行推理,实现了自然流畅的对话流。同时,通过多模态视频理解、跨模态信号生成等技术,百度成功克服了高可控交互、长时间一致性保持等难点,实现了高一致性的超拟真数字人长视频生成。
从技术角度看,百度数字人不仅展示了技术实力,更为AI技术如何从“热搜”走向实际应用提供了有力证明。对于商家而言,数字人直播不仅能大幅降低成本,还能提升效率。数据显示,数字人直播能平均降低约80%的成本,使商家可以将更多预算投入到供应链优化和市场推广中。
百度电商总经理平晓黎表示,相比追逐头部IP,百度更倾向于帮助中小商家和创作达人提升竞争力。这种“超级有用”的路径,或许比追求“超级应用”更具现实意义。
本文来源: