可灵AI视频生成技术领先，携手共创电影短片商业化新篇章

这次，名导们纷纷下场，带来了令人耳目一新的短片。影片一开始，钟馗手持斩鬼剑，穿梭在黑暗密林中，伴随着急促的锣鼓声，各种妖怪相继出现，营造出紧张恐怖的氛围。然而，一声长喝后，镜头一转，屏幕上出现了“勿扰模式”的提示，下方滚动着被拦截的信息：自动记账APP、视频会议、未知号码来电、微信群消息、风险网站链接，以及老板的电话……最终画面定格在“休假期间，百鬼勿扰”几个字上。原本以为是一部中式志怪片，没想到却是一部职场吐槽片。

更令人惊喜的是，这部由俞白眉导演执导的5分钟短片，竟然完全由可灵AI创作完成。三个月前，快手可灵AI联合了李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位知名导演，发起了“可灵AI导演共创计划”，制作了9部AIGC电影短片。12月6日，这些作品正式亮相。贾樟柯在《麦收》中利用AI的“对口型”功能，让机器人说起了山西汾阳话；叶锦添则通过“首尾帧”功能，描绘了外星快递员的太空冒险；王子川的《雏菊》则大量使用“图生视频”功能，通过重复蒙太奇和特效镜头，带来了强烈的视听冲击。

快手科技副总裁张迪表示，2024年视觉生成领域的AI大模型发展迅速，自6月发布以来，可灵AI已让众多用户感受到其在视频创作上的强大能力。这9部实验性质的电影短片，全部使用可灵AI生成，导演们完全依赖视频生成大模型进行创作，这在中国尚属首次。这些作品不仅在中国电影博物馆永久收藏，也为中国电影历史和未来创作探索做出了贡献。

可灵AI的发展历程可谓迅猛。今年年初，Sora的崛起点燃了AI视频生成赛道。6月6日，快手推出自研的“可灵AI”，成为全球首个真实影像级视频生成大模型。随后，可灵AI不断推出新功能，如图生视频、视频续写、运动笔刷等，提升了画面质量、指令遵从和运动幅度，并将生成视频时长延长至3分钟。9月19日，可灵1.5模型上线，进一步提升了画质、动态质量、美学表现、运动合理性和语义理解。全球网友纷纷利用可灵AI创作鬼畜视频，如蒙娜丽莎戴墨镜、熊猫弹吉他等。

在商业化方面，可灵AI同样领先。Web端、独立App的推出，构建了多端跨平台的产品矩阵，并开放了API服务，涵盖视频生成、图像生成和虚拟试穿等模块。10月18日，可灵AI启动“未来合伙人计划”，推出一站式AIGC生态合作平台，为创作者提供商业变现的新渠道。

截至目前，可灵AI已拥有超过600万用户，累计生成超过6500万个视频和1.75亿张图片。近期，可灵AI推出了AI人脸定制模型和AI试衣功能，解决了视频生成中的人物一致性问题，并为影视造型提供了新的工具。通过上传多角度视频，创作者可以生成人脸一致的视频结果，极大地提升了故事的连贯性和人物形象的一致性。

AI试衣功能则在图文生图模型基础上，引入了衣服SKU保持网络、人物Pose姿势、背景修复等技术，实现了任意衣服、任意身材、任意动作的试穿效果。这一功能不仅提高了影视制作中服装搭配和效果展示的效率，还为创作者提供了更多的创意空间。

快手可灵大模型团队不仅在技术上不断突破，还在学术界积极分享研究成果。他们提出了给视频生成模型量身定制的Scaling Law建模方法，大幅降低了实验试错成本。此外，他们还公开了高质量视频生成数据集Koala-36M，包含3600万个视频片段，平均时长13.75秒，分辨率达到720p，每个视频片段配有详细描述。

在视频生成的可控性和交互性方面，可灵团队取得了多项进展，如3D轨迹控制的视频生成项目3DTrajMaster、多机位视频生成项目SynCamMaster和精准视频风格化项目StyleMaster。这些项目不仅能够控制视频中主体的三维运动，还能根据用户描述生成多视角视频，并支持任意艺术风格的视频风格转换。

通过持续开放核心数据和技术组件，可灵团队为影视创作领域注入了新的动力，为未来的创意表达和创作开辟了更多可能性。回顾电影史，技术革新始终是推动电影产业发展的关键。从无声到有声，从黑白到彩色，从胶片到数字，每一次技术飞跃都促进了电影艺术的进步。如今，以可灵AI为代表的视觉大模型及产品，正在重塑影视行业的未来。

本文来源：