标签:世界模型
李飞飞自曝创业经历:因眼睛受伤坚定投身世界模型与三维空间表征研究,AI教母引领World Labs创新未来
(由多段落组成) 李飞飞在一次公开访谈中分享了她的创业心路历程,揭示了她对世界模型的坚定追求。五年前的一次角膜损伤使她暂时失去了立体视觉,这段经历不仅让她深刻体会到空间感知的重要性,也进一步坚定了她开发世界模型的决心。 在这次a16z播客节目中,李飞飞详细讲述了自己如何将这一意外转化为科研的动力。尽管单眼视物时的生活充满挑战,但作为科学家,她选择以积极的态度看待这次“实验”。她意识到,三维空间表征对于物理世界的交互至关重要,就像语言模型需要理解文本上下文一样。 在节目中,李飞飞还阐述了为...
知乎2024新知答主揭晓,AI Agent与多模态融合领域专家比重显著提升,展现世界模型前沿趋势
(由多段落组成): 5月24日,知乎第十一届新知青年大会在北京盛大举行,AI技术再次成为会议焦点。在主论坛上,拾象创始人兼CEO李广密分享了对AI Agent落地前景的见解。他认为,Coding Agent将是观察通用Agent发展的重要切入点,并有望在年内实现突破性进展。此外,他还强调了多模态融合在未来行业中的重要性,对构建“世界模型”表示高度期待。 除了技术层面的探讨,AI对人类表达方式的影响也引发了广泛关注。在主持人蔡康永、脱口秀演员梁海源等嘉宾看来,尽管AI具备强大的功能,但人类独特的思想、情感以及艺术表达中的“...
基础智能体与自进化:探索多智能体系统、世界模型及安全对齐的264页智能体综述——MetaGPT等20家顶尖机构、47位学者共同参与
近期,大模型智能体(Agent)的话题热度持续攀升——无论是Anthropic抢先推广的MCP范式,还是OpenAI推出的Agents SDK,以及谷歌最新发布的A2A协议,都表明了AI Agent领域蕴含的巨大潜力。然而,目前大多数Agent应用仅停留在大型语言模型(LLM)能力的简单封装或延伸阶段,距离真正的通用智能实体还有一定差距。在面对复杂的真实场景时,这些智能体往往暴露出推理规划、长期记忆、世界建模、自主进化及安全对齐等核心能力不足的问题。 为系统性应对上述挑战并构建具备通用能力的未来智能体,MetaGPT与Mila联合全球20所顶尖研究...
Runway AI视频生成技术实现高级相机控制,轻松打造电影级3D视觉大片,体验世界模型的无限魅力
Runway推出高级AI相机控制功能,打造电影级3D视觉效果 11月1日,美国知名AI视频生成公司Runway推出了其Gen-3 Alpha Turbo模型的新AI相机控制功能。这一功能允许用户在基于文本提示、上传的图像或现有视频生成新视频时,进行更精细的AI摄像机控制、动态视角调整和创意镜头运动,从而创造出更加逼真和生动的3D效果。 精细控制与动态视角 Runway的高级AI摄像头控件为用户提供了更精细的摄像机控制功能,使用户能够轻松实现对场景和主题的放大、缩小,同时保持AI生成角色的形态不变,以及背后背景的真实感,仿佛置身于真实的...
李飞飞被曝AI创业!做空间智能,已筹集种子轮融资
在人工智能领域享有盛誉的华裔科学家李飞飞,被誉为“AI教母”,近期正着手创建一家名为Spatial Intelligence的初创公司,致力于提升AI的高级推理能力。李飞飞因其开发的ImageNet数据集对计算机视觉技术的贡献而闻名,目前担任斯坦福大学计算机科学系首位红杉教授及HAI研究院联席院长。据悉,她的新创企已获得硅谷风投Andreessen Horowitz和Radical Ventures的支持。 在最近的TED大会上,李飞飞介绍了“空间智能”的概念,这是一种能让AI理解并预测3D环境中物体行为的技术。她以猫推杯子的例子说明,人类大脑可以瞬间分析并预测...