每日AI快讯
AI视频生成技术:可灵与Sora如何重塑影视行业的生产力工具
近年来,AI视频生成技术引发了广泛关注,一系列经典影视片段被AI改造,形成独特的新剧情,迅速走红短视频平台。抖音上,“AI扩图卷土重来”话题播放量高达3.9亿次,显示出AIGC(AI生成内容)的巨大潜力。这种技术不仅能创作文章、音乐,还能生成视频,带来无限创意。然而,AI介入后,内容的真实感与原版可能相去甚远,仿佛打开了一扇未知的潘多拉魔盒。 快手的“可灵”大模型在2024年世界人工智能大会上展示了其第三次重大升级,提升了视频生成的质感、美感和可玩性,引领了AI视频生成的新潮流。可灵AI网页版上线后,吸引了超过...
人机协同创作新篇章:AI大模型与可灵AI引领的AIGC短剧视频革命 – 快手体验
在2024年,Sora的出现引领了视频大模型的崛起,成为AI领域的焦点。中国科技企业紧随其后,努力推动视频大模型的广泛应用。可灵AI作为国内首个向公众开放的视频大模型平台,其在WAIC上展示了与快手团队合作的AIGC星芒短剧《山海奇镜之劈波斩浪》预告片。这部短剧在最近的线下活动中,展示了AI在影视制作中的实际应用。 《山海奇镜之劈波斩浪》凭借其高质量的AI生成效果,吸引了众多观众的关注。预告片中,细腻的画面和梦幻般的镜头展现了AI技术的惊人表现力。在快手的线下看片会上,观众体验到大银幕上AI带来的视觉冲击,如A...
TTT模型引领生成式AI革命:Transformers架构与隐藏状态提升机器学习效率
新一代人工智能的焦点——测试时间训练模型(TTT)正崭露头角,作为对Transformers架构的革新。Transformers,如OpenAI的Sora、Anthropic的Claude和谷歌的Gemini等模型的基础,虽然强大,但在处理大规模数据时面临计算效率低下的挑战。随着硬件需求的飙升,企业和环境可持续性面临压力。TTT模型应运而生,由斯坦福大学、加州大学圣地亚哥分校、伯克利分校和Meta的研究团队共同研发,历时一年半。TTT不仅能处理更多数据,而且计算能耗显著降低。 Transformers的核心是隐藏状态,一种存储处理内容的查找表。然而,这种设计使得...
字节跳动AI新动向预览:文生图技术或将创新长视频产业,豆包大模型引领短剧制作,抢先布局的公司一览(附相关概念股)
在即将到来的7月19日,字节跳动计划披露其在人工智能领域的最新突破,包括创新的文生图技术与类似Sora的新视频模型。这些AI模型特别在长视频和高动态场景中展现出独特优势,可能与OpenAI的Sora模型形成竞争态势。据知情人士透露,字节跳动已将AI大模型视为集团最高优先级项目。 在新加坡举行的ByteDance AI Luminary Talks活动中,字节跳动的研究科学家周大权将详细介绍关于“连续高动态的长视频生成方案”的前沿研究。作为短视频行业的领头羊,字节跳动在AI技术的每一步发展都受到广泛关注。这次文生视频的布局预示着相关AI...
谷歌推出Project Oscar:借助AI智能体,优化开源开发的自然语言交互体验
谷歌近日启动了一项名为“Project Oscar”的创新计划,旨在为开源开发团队提供支持,让他们能够利用人工智能(AI)智能体来管理软件项目。这一举措在谷歌2024年I/O Connect开发者活动中首次亮相,活动在印度的科技重镇班加罗尔举行。Project Oscar的核心是一个AI智能体开源平台,它能够协助软件团队监控并解决开发过程中的问题和故障,无需开发者额外编写代码。 该项目特别强调了自然语言交互的能力,使得AI智能体能够适应开发、规划、运行以及售后服务等多个环节。谷歌Go语言的产品经理,卡梅隆·巴拉汉,分享了Oscar已经在Go...
AI算力危机:高校研究遭遇GPU短缺,李飞飞与辛顿呼吁算力联盟解决人才流失挑战
随着人工智能(AI)研究的快速发展,美国高校正面临严重的算力短缺问题,这导致了AI研究的停滞和人才流失。 尽管顶级高校如斯坦福大学也在努力应对,但与大企业的庞大算力集群相比,差距悬殊。例如,Meta预计2024年底将拥有相当于60万块英伟达H100 GPU的算力,远超斯坦福大学的NLP实验室。许多高校甚至没有足够的GPU资源,一些学生不得不自费购买或寻求补贴。高校试图通过校际合作和转向低算力需求的AI研究来解决这一问题。算力短缺已引起人才流失,有志于生成式AI研究的学生转向大公司,因为大公司拥有成百上千倍于高校的...
AI实时语音与GPT-4o:RTC技术如何影响OpenAI的情感分析及多模态大模型延迟问题
在人工智能领域,OpenAI的最新模型GPT-4o以其高效能和低延迟引起了关注,尤其是在实时语音互动方面,达到了与人类对话相当的速度。然而,尽管发布会展示了令人惊叹的技术,但在产品落地过程中,诸如GPT-4o的实时音视频功能和视频多模态产品Sora的开放仍面临延迟。这种现象不仅困扰OpenAI,国内的类似项目也面临同样的问题。尽管实时语音被认为是AI商业化的重要路径,但现有的技术如Pi和Call Annie存在高延迟和情感理解不足的问题。新产品EVI通过引入语义空间理论来改进情感表达,但牺牲了响应时间。GPT-4o的多模态技术则显著...
全网庆贺!Andrej Karpathy投身AI+教育领域创业:源于热爱的创新之路
Andrej Karpathy,曾经在特斯拉和OpenAI任职,现宣布创立Eureka Labs,一家专注于人工智能与教育结合的初创公司。Eureka Labs致力于构建一个AI驱动的新式学校,利用教师与人工智能助教的协作模式,提供个性化的学习体验。首推产品是LLM101n,一个本科级别的AI训练课程,旨在让学生自主训练AI模型。课程内容涵盖语言建模到ChatGPT类似的Web应用程序。Karpathy对教育有着深厚的兴趣,从YouTube教程到斯坦福的CS231n,再到个人项目,他的职业生涯始终贯穿教育和AI。Eureka Labs的名字源于古希腊语中的“顿悟”感,目标是激发人们...
AI大模型困惑:数学理解挑战,9.11与9.9的大小常识判断,通用人工智能的Prompt工程难题
在编程领域,一些程序员可能会本能地认为9.11大于9.9,但这仅仅是在特定场景下。然而,当向AI大模型提出这个问题时,答案却五花八门,甚至出现了一些“失误”。Riley Goodside,一位在Scale AI工作的staff prompt engineer,通过推文分享了他发现的有趣现象。他向多个大模型输入“9.11and9.9- which is bigger?”,结果ChatGPT4o和Gemini Advanced等模型给出了错误的答案。尽管Claude3.5Sonnet在解释过程中差点回答正确,但最终还是陷入了误区。 这个问题引发了一场关于AI模型在基础数学理解上的讨论,有人提到了《歌手2024》排...
麦当劳餐饮行业新探索:AI技术与语音识别带来的自动点餐系统挑战
在21世纪的数字化浪潮中,AI技术对各行各业的影响日益显著,其中包括游戏设计师和电话客服等行业。尽管“AI导致失业”的话题曾引发热议,但实际情况是,AI的局限性也开始显现,一些AI项目已经面临挑战。最近,快餐巨头麦当劳宣布结束与IBM合作的AI点餐员项目,这标志着AI在餐饮业的应用并非一帆风顺。这个经过三年测试的自动点餐系统最终未能达到预期效果。 麦当劳的免下车服务“得来速”原本希望通过AI技术提高效率,但IBM的AI语音识别准确率仅为85%,导致每五个订单就需要人工干预。这表明,尽管AI点餐理论上能提供更快捷的服...