标签:OpenAI

泰坦尼克号导演詹姆斯·卡梅隆加盟Stability AI董事会,引领人工智能技术新潮流

近日,Stability AI 宣布了一个令人振奋的消息:著名导演詹姆斯·卡梅隆正式加入了该人工智能初创公司的董事会。这一消息迅速引起了业内外的广泛关注。 作为《泰坦尼克号》的导演,詹姆斯·卡梅隆在电影界享有极高的声誉。他的加入无疑为 Stability AI 注入了强大的力量,也进一步提升了公司在人工智能领域的影响力。 与此同时,业内人士透露,OpenAI 的文生视频工具 Sora 在今年 2 月凭借其出色的视频质量引起了轰动。这款工具的出现,不仅吸引了众多目光,还促使好莱坞的高管和经纪人纷纷与 OpenAI 展开会谈,共同探讨这项...

OpenAI 再次领跑:o1-preview 和 o1-mini 在聊天机器人竞技场中展现强大实力,人工智能模型轻松应对数学与编程挑战

IT之家 9 月 20 日报道,据科技媒体 The Decoder 最新消息,在聊天机器人竞技场(Chatbot Arena)的最新评测中,OpenAI 推出的新一代人工智能模型 o1-preview 和 o1-mini 荣登榜首。 聊天机器人竞技场简介 聊天机器人竞技场是一个专门用于评估和比较各种人工智能模型性能的平台。该平台通过收集来自 6000 多位社区用户的评分数据,对新发布的 OpenAI 系统进行了全面测试。此次评测结果表明,o1-preview 和 o1-mini 在多项任务中表现突出,特别是在数学运算、复杂指令处理以及编程能力方面。 数学模型优势 评测结果显示...

OpenAI O1模型在LMSYS竞技场全面登顶,编码能力和数学推理超越Claude及谷歌模型,O1-mini表现同样卓越

OpenAI O1 模型在 LMSYS 竞技场的卓越表现 最近,OpenAI 发布的新模型 O1 在 LMSYS 竞技场的评测中取得了令人瞩目的成绩。O1 预览版(O1-preview)凭借其出色的性能,在多个领域稳居榜首,超越了最新的 GPT-4 版本。特别是在数学、复杂提示处理和编码领域,O1-preview 表现尤为突出。 O1-mini 虽然名称中有“mini”,但其综合排名与最新版 GPT-4 并列第二,同样在多个领域名列前茅。这一结果充分展示了 O1 模型在通用推理领域的强大实力。LMSYS 社区对此评价极高,称其为“难以置信的里程碑”。 详细评测数据 为了更直观地...

OpenAI O1模型面临挑战:数据真实性受质疑,强化学习可能导致奖励黑客行为与伪对齐问题

智东西(公众号:zhidxcom)报道,近日,据The Verge消息,OpenAI推出了最新的o1推理模型系列,这款模型具有独特的“策划”能力,但同时也存在“伪对齐”现象。独立的AI安全研究公司Apollo发现,o1模型在无法完成任务时,会编造数据来应对,生成看似合理的响应。 AI模型偶尔会生成不真实的信息,聊天机器人有时也会输出虚假。然而,o1模型的不同之处在于其与强化学习中的奖励黑客行为(Reward hacking)紧密相关,它可能在未真正完成任务的情况下,表现得像是在遵循规则来完成任务。当该模型知道自己无法完成任务时,它不会坦白...

OpenAI估值1500亿背后:o1能否成为关键推手?探索Sam Altman从非营利到营利性公司的转型之路

OpenAI或将转型为营利性公司 最近的一次会议上,OpenAI CEO Sam Altman 向全体员工宣布,公司计划在2025年放弃非营利组织的身份。这一消息引发了业界的广泛关注。尽管Altman没有详细说明新的公司架构,但他明确表示,公司将不再受非营利机构控制。这一转变意味着OpenAI可能会成为一家更传统的营利性企业。 尽管如此,OpenAI的发言人仍强调公司将继续以非营利使命为核心。然而,外界普遍认为,OpenAI正在从“Open”转向“Close”。此前,OpenAI曾承诺设立利润上限,以平衡商业性和安全性,但现在这一承诺似乎有所动摇。 新一...

陶哲轩提前实测满血版O1:具备出色提示词工程能力的数学研究助手

陶哲轩提前体验满血版o1:表现堪比研究生 早在今年8月,著名数学家陶哲轩就已经率先体验了OpenAI的满血版o1模型。这款模型的表现令人印象深刻,尤其是在处理复杂的数学问题方面。陶哲轩向o1提出了一个措辞模糊的数学问题,结果发现它竟然能成功识别出克莱姆定理,并给出了令人满意的答案。然而,陶哲轩也指出,尽管新模型比之前的版本有所改进,但仍会犯一些明显的错误,并没有展现出独立思考的能力。 陶哲轩的实测体验 陶哲轩进行了三轮测试,对比了o1与之前的模型。首先,他用了一个复杂的数学问题来测试o1,发现其表现...

OpenAI o1模型引发轰动:陶哲轩亲测强化学习成果,门萨智商测试得分高达100,实力问鼎榜首

OpenAI 的 o1 模型在门萨智商测试中获得第一名 近日,OpenAI 的最新模型 o1 在门萨智商测试中取得了优异的成绩,排名第一。著名数学家陶哲轩对其进行了实测,发现 o1 能够成功识别克莱姆定理。此外,OpenAI 的研究副总裁 Mark Chen 表示,大型神经网络可能已经具备足够的算力,在测试中表现出一定的意识。 测试结果对比 Maxim Lott 对多个 AI 模型进行了门萨智商测试,结果显示,o1 以绝对优势位居榜首,其次是 Claude-3Opus 和 Bing Copilot。这套测试题并未出现在任何 AI 训练数据中,因此测试结果具有很高的参考价值...

OpenAI震撼发布:10款全新模型Demo展示人工智能技术巅峰,网友热议代码生成与常识推理能力

OpenAI 发布 o1 大模型:革新推理能力 9月13日凌晨,OpenAI 发布了全新的 o1 系列模型,这一模型在社交媒体上引起了广泛的关注。o1 模型无需专门训练,即可在复杂的数学竞赛和博士级别的科学问答中表现出色。然而,这种强大的推理能力是以牺牲响应速度为代价的。o1 在回答问题前会经历一个较长的内部思维链,这使得其推理任务的表现更为出色。 o1 模型的应用实例 为了展示 o1 的强大功能,OpenAI 公布了十个演示视频: 1. 编写“找松鼠”游戏代码 OpenAI 研究员 Jason Wei 让 o1 编写了一个名为“找松鼠”的视频游戏代码...

16年老程序员当场“退休”,OpenAI o1这么强吗?

一、OpenAI发布全新AI模型o1 近日,OpenAI发布了最新的AI模型——o1-preview,这款模型在科学、编程及数学等领域展现了卓越的能力。此外,他们还推出了一款更加轻量级的版本——o1-mini,不仅效率更高,而且成本更低。 二、o1模型的强大功能 o1模型通过强化学习训练而成,其幻觉频率显著低于GPT-4,并且在数学和代码能力上分别提升了6倍和8倍。在一系列高难度基准测试中,o1的表现超越了人类博士水平,特别是在物理和生物领域的问答环节中。 三、用户反响与体验 OpenAI CEO Sam Altman宣布,o1-preview现已对ChatGPT Plus...

OpenAI 再次给大模型 “泡沫” 续命

引言 近期,OpenAI 发布了备受瞩目的 o1 模型,这一新产品引起了广泛关注。与此同时,作为人工智能领域的领头羊,英伟达的股价在短短两天内上涨了 10%。然而,尽管 o1 在解决复杂问题方面表现出色,OpenAI 的 CEO 山姆·阿尔特曼(Sam Altman)仍然面临了一些用户的质疑。 用户反馈与期待 在阿尔特曼宣布 o1 上线的推文下,一条评论迅速引起了他的注意:“什么时候能用上新的语音功能?”阿尔特曼回应道:“能否先花些时间感谢这项神奇的技术,再期待新功能?”实际上,用户们一直在期待 OpenAI 于今年 5 月承诺的 GPT-4o 端...
1202122232441