B站团队推出开源项目AniSora,助力动漫视频生成与虚拟主播内容创作

感谢IT之家网友软媒用户1392612 提供的线索!5月18日消息,B站团队在5月12日宣布开源了一款名为AniSora动漫视频生成模型。这款模型能够轻松生成多种风格的动漫视频片段,涵盖系列剧集、国产原创动画、漫画改编作品、虚拟主播(VTuber)、动漫PV以及鬼畜动画等。

B站团队指出,在当前影视行业中,动画备受瞩目。尽管像Sora、Kling、CogVideoX等先进模型在自然视频生成领域表现出色,但在动漫视频生成方面仍存在不足。由于动漫独特的艺术风格、夸张的动作表现以及对物理规律的突破,这些都为评测带来了巨大挑战。因此,该项目提出了完整的系统AniSora,包括以下几个方面:

– 数据处理流水线:拥有超过1000万条高质量数据。
– 可控生成模型:引入时空掩码模块,支持从图像生成视频、帧插值、局部图像引导等关键动画制作功能。
– 评测数据集:收集了948段多样化的动画视频,并进行了双盲人评实验及VBench测试,确保人物一致性与运动一致性达到最佳水平。

以下是AniSora生成的一些示例视频描述:

示例1:图中人物坐在一辆向前行驶的汽车里,向后挥手,头发随风左右摇摆。

示例2:场景显示两名身穿红色婚服的人物手持红绳走向远方。

示例3:金发人物伸手触摸跪着的人物头部,跪着的人物随着呼吸身体上下起伏。

示例4:视频中一名白发女孩跳舞,镜头逐渐拉近。她一边唱歌一边将右手旋转向镜头,手指张开。

示例5:视频中有五名女孩跳舞,镜头逐渐拉近。她们一边唱歌一边将左手举过头顶,然后下拉至膝盖高度。

示例6:帧中一个人高速向前冲刺,动作因速度而略显模糊。

示例7:帧中角色举起手臂,表面可见气流流动。

示例8:老人凝视着宝石,右手微调放大镜,嘴唇在动,仿佛这颗宝石是解开某些古老知识或秘密的关键。

示例9:左边的男人紧闭双唇,脸上刻着愤怒和决心。他的每一个表情都散发着深深的挫败感和坚定不移的信念。与此同时,另一个人张开嘴巴,似乎即将爆发成一声喊叫或激情宣言。

示例10:场景描绘了一块岩石爆炸,发出耀眼的光芒,碎片四散飞溅。

以下是AniSora的开源地址:
– https://github.com/bilibili/Index-anisora/tree/main
– https://huggingface.co/IndexTeam/Index-anisora
– https://www.modelscope.cn/organization/bilibili-index

请注意,文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含此声明。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...