标签:GPT-4o

DreamBench++引领新纪元:GPT-4o驱动的图像生成评估与个性化图像分析,多模态数据集助力自动化评测

随着个性化图像生成技术的快速发展,一个亟待解决的问题浮出水面:如何统一标准来评判生成图片的质量和人类喜好。为了解决这个问题,清华大学、西安交通大学、伊利诺伊大学厄巴纳-香槟分校、中国科学院和旷视科技的研究团队共同推出了一项创新基准——DreamBench++。 DreamBench++借助GPT-4o模型,通过多模态输入和精心设计的prompt,使模型能够进行与人类偏好相一致的自动化图像评估。在评估过程中,研究团队采用了7位专业标注员的评分作为参照,对比了7种不同的图像生成方法。实验结果显示,DreamBench++的评估与人类评价高...

人工智能新突破:GPT-4o展现超越专家的道德推理与伦理决策能力,人类监督下的智能进化

近日,一项由北卡罗莱纳大学教堂山分校和艾伦AI研究所联合开展的研究揭示了人工智能在道德推理领域取得的重大突破。OpenAI的最新聊天机器人GPT-4o在测试中表现出超越人类道德专家的水平,其道德建议被广大美国成年人认为更合规、可信且体贴。在501位美国成人的评估中,GPT-3.5-turbo模型的道德解释超过了人类的标准。进一步的研究对比了GPT-4o与知名伦理学者Kwame Anthony Appiah的建议,AI在50个伦理问题上的表现几乎在所有方面都优于人类专家,其建议被认为是更道德、更可靠、更周全且准确。 这一成果引发了对AI在道德和...

OpenAI的GPT-4o:人工智能在道德推理上的突破超越伦理学家的预期,考虑文化差异

最新的科研发现揭示,OpenAI的GPT-4o聊天机器人在道德解释和建议方面展现出超越人类专家的能力。根据The Decoder的报道,北卡罗莱纳大学教堂山分校和艾伦AI研究所的学者进行了两组研究,以评估大语言模型在道德推理上的效能。在第一项研究中,501名美国成年人比较了GPT-3.5-turbo模型与人类的道德解释,结果显示,AI的解释被认为更道德、更可信、更周全。第二项研究则将GPT-4o的建议与《纽约时报》伦理学家Kwame Anthony Appiah的建议进行对比,AI在多数指标上表现更优,仅在识别微妙差异上与人类相当。研究人员提出,AI可能...

Ryan Greenblatt的GPT-4o打破通用人工智能ARC-AGI基准,实现71%新高,证明LLMs学习能力里程碑式突破!

【新智元报道】近日,AI领域传来重大突破,GPT-4o模型在ARC-AGI基准测试中取得了前所未有的成绩,打破了之前无人能及的纪录。ARC-AGI,作为评估通用人工智能的重要标准,由François Chollet设计,被认为很难被轻易超越。然而,GPT-4o在公共测试集上的准确率达到了50%,在训练集的保留子集上更是高达71%,一举成为新的SOTA! 这个基准测试自2020年起在Kaggle平台上举办,当年的冠军团队icecuber在测试集上的成功率仅为21%,证明了ARC-AGI的挑战性。然而,GPT-4o的表现打破了这一局面,标志着通用AI的进步迈出了重要一步。此...

苹果一夜重塑iPhone!GPT-4o加持Siri,AI深入所有APP,库克:开启苹果AI下一章

苹果在最新的WWDC上揭示了其iPhone的AI转型,通过与OpenAI的合作和引入GPT-4o,Siri得到了显著提升,使iPhone迈向AI Phone时代。Apple Intelligence成为苹果设备的核心,提供了语言、图像、行动和个性化的AI功能。iOS和iPadOS在Apple Intelligence的加持下,AI体验大幅提升,包括智能通知排序、写作工具增强、图像生成和编辑、跨APP操作等。此外,Siri的更新使其更加自然、智能,能够理解上下文、执行复杂任务,并支持语音输入和屏幕内容感知。iOS 18引入了更多个性化设置,如深色模式、自定义控制中心和锁定APP功能。iPadOS...

OpenAI 推出为大学开发的 ChatGPT Edu 教育版,对话和数据不用于训练模型

OpenAI发布ChatGPT Edu,助力大学AI教育与应用 随着科技的快速发展,OpenAI在5月30日推出了全新的ChatGPT Edu版本,专门针对高等教育领域,旨在服务学生、教师、研究人员及校园管理者。这个创新平台利用了GPT-4o的强大功能,不仅在文本理解、编码和数学问题解决上表现出色,还能进行数据分析和视觉推理,为校园生活带来智能化解决方案。 ChatGPT Edu提供了企业级的安全保障和管理措施,同时价格适宜,对教育机构而言极具吸引力。通过这款工具,学生可以得到个性化的学习辅导,简历也能得到专业审查;研究人员能够借助它来...

AI化身恋爱军师,大模型分析爱情靠谱吗?

随着AI技术的快速发展,它已经渗透到各个领域,甚至包括恋爱咨询。最近,小红书博主分享了如何利用AI工具Kimi分析情侣的聊天记录,以洞察双方性格和增进感情。Kimi能识别出情侣的个性特征,预测追求过程,甚至协助挑选水果。与此同时,GPT-4o作为全能型AI,不仅能处理多种输入,还能帮助人们分析潜在伴侣的喜好,模拟恋爱策略。然而,AI在提供便利的同时,也引发了关于隐私保护和真实性的问题。AI可能会收集大量个人数据,增加隐私泄露的风险。政策制定者和用户都需要关注AI技术的安全隐患,确保在享受便利的同时保护个人隐...

OpenAI与Google巨头对线后,开发者如何快速加入战局?

1. 在OpenAI与Google的竞争背景下,业界专家讨论了在资源有限的情况下,如何有效地训练高性能动态模型。 2. GPT-4o的发布引发了关于商业化和免费策略的讨论,尤洋指出模型工程化和产品化的重要性,认为OpenAI的模型优化和用户体验良好。 3. 骆轶航和栾小凡认为OpenAI在多模态处理和端到端处理上取得突破,预示着行业和应用开发者将迎来新的机遇。 4. 薛彦泽和王兆洋提到,OpenAI的产品发布策略可能会影响市场反应,强调了AI产品化和多模态融合模型在用户体验和行业变革中的作用。 5. Google I/O大会上,Google展示了其在多模...

微软深夜再掀 AI 生产力革命:阿尔特曼登台“自曝”新模型、定制 Copilot

微软在开发者大会上展示了其在AI生产力领域的革新,重点介绍了Copilot的广泛应用。Copilot不仅限于AI PC,还包括日常生活助手和开发者工具堆栈。微软CEO萨姆·阿尔特曼透露,下一代模型将引入新的模态和整体智能,以增强模型的安全性和效能。GPT-4o的发布展示了API技术的迅速应用,开发者正在创造前所未有的创新应用。GitHub Copilot通过对话式整合工作流程,减少了开发者在非编码任务上的时间,同时支持多种开发工具和平台。此外,微软还推出了一系列定制Copilot的功能,如从SharePoint创建Copilot和使用Copilot Studio,以...

微软昨夜AI全家桶狂飙:GPT-4o上云,纳德拉现场表白OpenAI,Altman剧透新模型

微软在2024年Build大会上宣布了一系列AI能力更新,涉及GPT-4o、Cobalt芯片、Copilot、小模型等多个领域。会上,微软宣布GPT-4o在Azure AI上可用,并引入多家公司及开源社区的大模型。Windows Copilot库将在6月推出,包含多种模型和本地API。微软还推出了多模态SLM Phi-3-vision,以及端侧小模型Phi-Silica,专为Copilot+PC设计。此外,微软将通过Windows DirectML支持PyTorch和WebNN框架,提供对PyTorch的原生支持。团队版Copilot和Copilot连接器也相继发布,旨在助力企业构建和定制AI解决方案。微软还展示了其自研Cobalt芯...