B站团队推出开源项目AniSora，助力动漫视频生成与虚拟主播内容创作

每日AI快讯1年前 (2025)发布 AI部落小助手

感谢IT之家网友软媒用户1392612 提供的线索！5月18日消息，B站团队在5月12日宣布开源了一款名为AniSora的动漫视频生成模型。这款模型能够轻松生成多种风格的动漫视频片段，涵盖系列剧集、国产原创动画、漫画改编作品、虚拟主播（VTuber）、动漫PV以及鬼畜动画等。

B站团队指出，在当前影视行业中，动画备受瞩目。尽管像Sora、Kling、CogVideoX等先进模型在自然视频生成领域表现出色，但在动漫视频生成方面仍存在不足。由于动漫独特的艺术风格、夸张的动作表现以及对物理规律的突破，这些都为评测带来了巨大挑战。因此，该项目提出了完整的系统AniSora，包括以下几个方面：

– 数据处理流水线：拥有超过1000万条高质量数据。
– 可控生成模型：引入时空掩码模块，支持从图像生成视频、帧插值、局部图像引导等关键动画制作功能。
– 评测数据集：收集了948段多样化的动画视频，并进行了双盲人评实验及VBench测试，确保人物一致性与运动一致性达到最佳水平。

以下是AniSora生成的一些示例视频描述：

示例1：图中人物坐在一辆向前行驶的汽车里，向后挥手，头发随风左右摇摆。

示例2：场景显示两名身穿红色婚服的人物手持红绳走向远方。

示例3：金发人物伸手触摸跪着的人物头部，跪着的人物随着呼吸身体上下起伏。

示例4：视频中一名白发女孩跳舞，镜头逐渐拉近。她一边唱歌一边将右手旋转向镜头，手指张开。

示例5：视频中有五名女孩跳舞，镜头逐渐拉近。她们一边唱歌一边将左手举过头顶，然后下拉至膝盖高度。

示例6：帧中一个人高速向前冲刺，动作因速度而略显模糊。

示例7：帧中角色举起手臂，表面可见气流流动。

示例8：老人凝视着宝石，右手微调放大镜，嘴唇在动，仿佛这颗宝石是解开某些古老知识或秘密的关键。

示例9：左边的男人紧闭双唇，脸上刻着愤怒和决心。他的每一个表情都散发着深深的挫败感和坚定不移的信念。与此同时，另一个人张开嘴巴，似乎即将爆发成一声喊叫或激情宣言。

示例10：场景描绘了一块岩石爆炸，发出耀眼的光芒，碎片四散飞溅。

以下是AniSora的开源地址：
– https：//github.com/bilibili/Index-anisora/tree/main
– https：//huggingface.co/IndexTeam/Index-anisora
– https：//www.modelscope.cn/organization/bilibili-index

请注意，文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含此声明。

本文来源：