TTT模型引领生成式AI革命:Transformers架构与隐藏状态提升机器学习效率
新一代人工智能的焦点——测试时间训练模型(TTT)正崭露头角,作为对Transformers架构的革新。Transformers,如OpenAI的Sora、Anthropic的Claude和谷歌的Gemini等模型的基础,虽然强大,但在处理大规模数据时面临计算效率低下的挑战。随着硬件需求的飙升,企业和环境可持续性面...
字节跳动AI新动向预览:文生图技术或将创新长视频产业,豆包大模型引领短剧制作,抢先布局的公司一览(附相关概念股)
在即将到来的7月19日,字节跳动计划披露其在人工智能领域的最新突破,包括创新的文生图技术与类似Sora的新视频模型。这些AI模型特别在长视频和高动态场景中展现出独特优势,可能与OpenAI的Sora模型形成竞争态势。据知情人士透露,字节跳动已将AI大模型视为集团最高优先级项目。...
谷歌推出Project Oscar:借助AI智能体,优化开源开发的自然语言交互体验
谷歌近日启动了一项名为“Project Oscar”的创新计划,旨在为开源开发团队提供支持,让他们能够利用人工智能(AI)智能体来管理软件项目。这一举措在谷歌2024年I/O Connect开发者活动中首次亮相,活动在印度的科技重镇班加罗尔举行。Project Oscar的核心是一个AI智能体开源平台,...
AI算力危机:高校研究遭遇GPU短缺,李飞飞与辛顿呼吁算力联盟解决人才流失挑战
随着人工智能(AI)研究的快速发展,美国高校正面临严重的算力短缺问题,这导致了AI研究的停滞和人才流失。 尽管顶级高校如斯坦福大学也在努力应对,但与大企业的庞大算力集群相比,差距悬殊。例如,Meta预计2024年底将拥有相当于60万块英伟达H100 GPU的算力,远超斯坦福大学...
AI实时语音与GPT-4o:RTC技术如何影响OpenAI的情感分析及多模态大模型延迟问题
在人工智能领域,OpenAI的最新模型GPT-4o以其高效能和低延迟引起了关注,尤其是在实时语音互动方面,达到了与人类对话相当的速度。然而,尽管发布会展示了令人惊叹的技术,但在产品落地过程中,诸如GPT-4o的实时音视频功能和视频多模态产品Sora的开放仍面临延迟。这种现象不仅...
全网庆贺!Andrej Karpathy投身AI+教育领域创业:源于热爱的创新之路
Andrej Karpathy,曾经在特斯拉和OpenAI任职,现宣布创立Eureka Labs,一家专注于人工智能与教育结合的初创公司。Eureka Labs致力于构建一个AI驱动的新式学校,利用教师与人工智能助教的协作模式,提供个性化的学习体验。首推产品是LLM101n,一个本科级别的AI训练课程,旨在让...
AI大模型困惑:数学理解挑战,9.11与9.9的大小常识判断,通用人工智能的Prompt工程难题
在编程领域,一些程序员可能会本能地认为9.11大于9.9,但这仅仅是在特定场景下。然而,当向AI大模型提出这个问题时,答案却五花八门,甚至出现了一些“失误”。Riley Goodside,一位在Scale AI工作的staff prompt engineer,通过推文分享了他发现的有趣现象。他向多个大模型输入“...
麦当劳餐饮行业新探索:AI技术与语音识别带来的自动点餐系统挑战
在21世纪的数字化浪潮中,AI技术对各行各业的影响日益显著,其中包括游戏设计师和电话客服等行业。尽管“AI导致失业”的话题曾引发热议,但实际情况是,AI的局限性也开始显现,一些AI项目已经面临挑战。最近,快餐巨头麦当劳宣布结束与IBM合作的AI点餐员项目,这标志着AI在餐饮业...
字节跳动AI技术新突破:7月19日揭晓文生图及长视频模型重大进展,豆包大模型引领语音识别创新
在即将到来的7月19日,字节跳动科技公司计划在其人工智能(AI)技术领域迈出重要一步。据钛媒体AGI报道,该公司将在本周五首次大规模展示其先进的AI模型技术,其中包括文生图和类Sora新视频技术。这些创新技术尤其在长视频和高动态图像处理方面展现出强大的潜力,有可能与Sora...
闲人一坤挑战AI原创短剧:借助山海奇镜与快手,10日打造全网爆款视频,AI视频技术让创作触手可及
《山海奇镜》是一部开创性的AI原创玄幻短剧,凭借其独特魅力吸引了大量观众。在快手平台上仅3集播放量已破千万,全网浏览量超过60万,甚至登陆院线大屏幕。该剧以《山海经》为背景,讲述人与神奇神兽之间的冒险故事,每个单元都有精彩纷呈的情节。《劈波斩浪》是首个单元,聚焦...
