这次,名导们纷纷下场,带来了令人耳目一新的短片。影片一开始,钟馗手持斩鬼剑,穿梭在黑暗密林中,伴随着急促的锣鼓声,各种妖怪相继出现,营造出紧张恐怖的氛围。然而,一声长喝后,镜头一转,屏幕上出现了“勿扰模式”的提示,下方滚动着被拦截的信息:自动记账APP、视频会议、未知号码来电、微信群消息、风险网站链接,以及老板的电话……最终画面定格在“休假期间,百鬼勿扰”几个字上。原本以为是一部中式志怪片,没想到却是一部职场吐槽片。
更令人惊喜的是,这部由俞白眉导演执导的5分钟短片,竟然完全由可灵AI创作完成。三个月前,快手可灵AI联合了李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位知名导演,发起了“可灵AI导演共创计划”,制作了9部AIGC电影短片。12月6日,这些作品正式亮相。贾樟柯在《麦收》中利用AI的“对口型”功能,让机器人说起了山西汾阳话;叶锦添则通过“首尾帧”功能,描绘了外星快递员的太空冒险;王子川的《雏菊》则大量使用“图生视频”功能,通过重复蒙太奇和特效镜头,带来了强烈的视听冲击。
快手科技副总裁张迪表示,2024年视觉生成领域的AI大模型发展迅速,自6月发布以来,可灵AI已让众多用户感受到其在视频创作上的强大能力。这9部实验性质的电影短片,全部使用可灵AI生成,导演们完全依赖视频生成大模型进行创作,这在中国尚属首次。这些作品不仅在中国电影博物馆永久收藏,也为中国电影历史和未来创作探索做出了贡献。
可灵AI的发展历程可谓迅猛。今年年初,Sora的崛起点燃了AI视频生成赛道。6月6日,快手推出自研的“可灵AI”,成为全球首个真实影像级视频生成大模型。随后,可灵AI不断推出新功能,如图生视频、视频续写、运动笔刷等,提升了画面质量、指令遵从和运动幅度,并将生成视频时长延长至3分钟。9月19日,可灵1.5模型上线,进一步提升了画质、动态质量、美学表现、运动合理性和语义理解。全球网友纷纷利用可灵AI创作鬼畜视频,如蒙娜丽莎戴墨镜、熊猫弹吉他等。
在商业化方面,可灵AI同样领先。Web端、独立App的推出,构建了多端跨平台的产品矩阵,并开放了API服务,涵盖视频生成、图像生成和虚拟试穿等模块。10月18日,可灵AI启动“未来合伙人计划”,推出一站式AIGC生态合作平台,为创作者提供商业变现的新渠道。
截至目前,可灵AI已拥有超过600万用户,累计生成超过6500万个视频和1.75亿张图片。近期,可灵AI推出了AI人脸定制模型和AI试衣功能,解决了视频生成中的人物一致性问题,并为影视造型提供了新的工具。通过上传多角度视频,创作者可以生成人脸一致的视频结果,极大地提升了故事的连贯性和人物形象的一致性。
AI试衣功能则在图文生图模型基础上,引入了衣服SKU保持网络、人物Pose姿势、背景修复等技术,实现了任意衣服、任意身材、任意动作的试穿效果。这一功能不仅提高了影视制作中服装搭配和效果展示的效率,还为创作者提供了更多的创意空间。
快手可灵大模型团队不仅在技术上不断突破,还在学术界积极分享研究成果。他们提出了给视频生成模型量身定制的Scaling Law建模方法,大幅降低了实验试错成本。此外,他们还公开了高质量视频生成数据集Koala-36M,包含3600万个视频片段,平均时长13.75秒,分辨率达到720p,每个视频片段配有详细描述。
在视频生成的可控性和交互性方面,可灵团队取得了多项进展,如3D轨迹控制的视频生成项目3DTrajMaster、多机位视频生成项目SynCamMaster和精准视频风格化项目StyleMaster。这些项目不仅能够控制视频中主体的三维运动,还能根据用户描述生成多视角视频,并支持任意艺术风格的视频风格转换。
通过持续开放核心数据和技术组件,可灵团队为影视创作领域注入了新的动力,为未来的创意表达和创作开辟了更多可能性。回顾电影史,技术革新始终是推动电影产业发展的关键。从无声到有声,从黑白到彩色,从胶片到数字,每一次技术飞跃都促进了电影艺术的进步。如今,以可灵AI为代表的视觉大模型及产品,正在重塑影视行业的未来。
本文来源: 机器之心公众号【阅读原文】