标签:GPT-4o
GPT-4o 与 OpenAI:人工智能模型训练中的安全风险探究——一场诡异尖叫引发的32页技术研究报告
近期,OpenAI发布了关于其最新模型GPT-4o的红队安全报告,揭示了这款“全能”模型的一些意外行为和潜在风险。原本期待重大更新的网友们,收到了一份长达32页的详细报告,而非期待中的功能升级。 引人关注的异常行为 报告中最引人注目的部分之一是GPT-4o偶尔会模仿用户的语音,甚至发出尖叫声。这一行为不仅令人惊讶,也让用户感到不安。此外,报告还提到在特定的恶意提示下,模型可能会产生不适宜的内容,如色情呻吟或暴力声音。 技术挑战与安全考量 GPT-4o是一款能够处理文本、音频、图像和视频输入的模型,其复杂性带来...
360集结16家大模型,利用专家协同架构CoE,打造无敌AI助手团队:全面展现普惠AI实力,多项指标超越GPT-4o
国产大模型联合体:挑战GPT-4o的新力量 在人工智能领域,国产大模型正逐步展现其竞争力。一项由360发起的联合项目,集结了包括百度、腾讯、阿里巴巴等在内的16家顶尖企业,共同打造了一个能够与GPT-4o相抗衡的强大模型。这一联合体在12项指标测试中,有11项超越了GPT-4o,并在中文特色领域如诗词赏析等方面表现出色。 技术创新:专家协同架构CoE 支撑这一联合体的核心技术是360独有的专家协同架构(CoE)。不同于传统的混合专家架构(MoE),CoE通过高效的意图识别和任务调度机制,实现了资源的最优配置,大幅提升了处理...
OpenAI震撼更新!GPT-4O推出先进人工智能语音对话系统,问题瞬间得到解答,引爆网友热议
OpenAI 推出 GPT-4O 高级语音模式 初步体验分享 智东西7月31日最新报道,OpenAI近日宣布已开始向一部分ChatGPT Plus用户推送期待已久的高级语音模式。该功能基于GPT-4O,能够提供更为流畅自然的实时对话体验,支持用户随时中断对话以及识别并响应用户的情感变化。 高级语音模式初探:安全与创新并行 该模式自去年9月首次亮相以来,经历了一系列升级和完善。今年5月,OpenAI推出了基于GPT-4O的增强版语音对话功能,并进行了公开演示。此次演示展示了语音功能的显著提升,包括更低的延迟、更丰富的交互形式,如通过视频理...
OpenAI与GPT-4o:《Her》项目的挑战——探究实时音视频对话及RTC技术在法律纠纷中的影响
自从5月14日OpenAI展示了GPT-4o及其令人惊叹的端到端实时音视频对话功能以来,大众一直热切期盼其公开发布版本的到来。然而,两个月又两周过去了,这款备受期待的产品仍未面世。虽然官方演示中展现出了AI对话几乎与真人无异的能力,包括感知呼吸节奏、丰富的语气反馈以及即时打断AI等功能,但公众至今仍未体验到这一技术。究竟哪些因素阻碍了OpenAI的步伐? 一方面,OpenAI面临着法律纠纷的压力,必须确保语音音色不会引发类似斯佳丽·约翰逊那样的争议;另一方面,安全性和防止潜在的诈骗行为也是重要考量。除此之外,还有...
扎克伯格大招被扒光!开源大模型打脸GPT-4o商业化路径也已隐现
Meta的LLaMA 3.1 405B:一场开源AI的胜利? 科技界再次掀起波澜,Meta计划在当地时间7月23日揭晓其最新力作——LLaMA 3.1 405B,一款拥有4050亿个参数的巨无霸模型,具备多模态处理能力,能够轻松应对图像与文本的生成与理解任务。然而,这款备受期待的模型竟在正式亮相前遭遇意外泄露,信息迅速在开源AI社区Hugging Face上流传开来,引发广泛关注。 泄露的细节揭示,LLaMA 3.1 405B在多项关键AI基准测试中的表现令人瞩目,甚至超越了竞争对手Claude 3.5 Sonnet,成为MMLU-Pro评估中的新王者。虽然在某些特定测试中稍显逊色...
AI实时语音与GPT-4o:RTC技术如何影响OpenAI的情感分析及多模态大模型延迟问题
在人工智能领域,OpenAI的最新模型GPT-4o以其高效能和低延迟引起了关注,尤其是在实时语音互动方面,达到了与人类对话相当的速度。然而,尽管发布会展示了令人惊叹的技术,但在产品落地过程中,诸如GPT-4o的实时音视频功能和视频多模态产品Sora的开放仍面临延迟。这种现象不仅困扰OpenAI,国内的类似项目也面临同样的问题。尽管实时语音被认为是AI商业化的重要路径,但现有的技术如Pi和Call Annie存在高延迟和情感理解不足的问题。新产品EVI通过引入语义空间理论来改进情感表达,但牺牲了响应时间。GPT-4o的多模态技术则显著...
菲尔兹奖得主挑战GPT-4:过河问题解答受挫,LLM能力遭LeCun质疑,Claude 3.5推理表现令人咋舌
菲尔兹奖得主Timothy Gowers最近测试了大模型如GPT-4o和Claude3.5解决经典“狼-山羊-卷心菜”过河问题的能力,结果表明这些大模型在该问题上表现不佳。 Gowers提出了一个新的评估标准——废话比率,即模型给出的错误答案与正确答案的比例。在简单的过河问题上,大模型的废话比率甚至高达5倍。在更复杂的100和1000只鸡过河问题中,尽管GPT-4o在100只鸡问题上答对了,但在1000只鸡问题上表现出严重错误,废话比率达到了125倍。测试显示,即使在被告知无需过河的情况下,模型仍然给出了复杂的解决方案。而Claude3.5在类似问题上也...
DreamBench++引领新纪元:GPT-4o驱动的图像生成评估与个性化图像分析,多模态数据集助力自动化评测
随着个性化图像生成技术的快速发展,一个亟待解决的问题浮出水面:如何统一标准来评判生成图片的质量和人类喜好。为了解决这个问题,清华大学、西安交通大学、伊利诺伊大学厄巴纳-香槟分校、中国科学院和旷视科技的研究团队共同推出了一项创新基准——DreamBench++。 DreamBench++借助GPT-4o模型,通过多模态输入和精心设计的prompt,使模型能够进行与人类偏好相一致的自动化图像评估。在评估过程中,研究团队采用了7位专业标注员的评分作为参照,对比了7种不同的图像生成方法。实验结果显示,DreamBench++的评估与人类评价高...
人工智能新突破:GPT-4o展现超越专家的道德推理与伦理决策能力,人类监督下的智能进化
近日,一项由北卡罗莱纳大学教堂山分校和艾伦AI研究所联合开展的研究揭示了人工智能在道德推理领域取得的重大突破。OpenAI的最新聊天机器人GPT-4o在测试中表现出超越人类道德专家的水平,其道德建议被广大美国成年人认为更合规、可信且体贴。在501位美国成人的评估中,GPT-3.5-turbo模型的道德解释超过了人类的标准。进一步的研究对比了GPT-4o与知名伦理学者Kwame Anthony Appiah的建议,AI在50个伦理问题上的表现几乎在所有方面都优于人类专家,其建议被认为是更道德、更可靠、更周全且准确。 这一成果引发了对AI在道德和...
OpenAI的GPT-4o:人工智能在道德推理上的突破超越伦理学家的预期,考虑文化差异
最新的科研发现揭示,OpenAI的GPT-4o聊天机器人在道德解释和建议方面展现出超越人类专家的能力。根据The Decoder的报道,北卡罗莱纳大学教堂山分校和艾伦AI研究所的学者进行了两组研究,以评估大语言模型在道德推理上的效能。在第一项研究中,501名美国成年人比较了GPT-3.5-turbo模型与人类的道德解释,结果显示,AI的解释被认为更道德、更可信、更周全。第二项研究则将GPT-4o的建议与《纽约时报》伦理学家Kwame Anthony Appiah的建议进行对比,AI在多数指标上表现更优,仅在识别微妙差异上与人类相当。研究人员提出,AI可能...