标签:GPT-4o
「Her」主创 Alexis Conneau 宣布从 OpenAI 离职创业
近期,OpenAI 的一位关键技术人员宣布离职,引起了广泛关注。这位技术人员名叫 Alexis Conneau(亚历克西斯·康诺),他是 OpenAI 版「Her」的技术负责人,同时也是 GPT-4o 实时音频技术的重要贡献者之一。在社交媒体上,他的个人简介显示他还参与了 GPT-5 的研发工作。然而,在 ChatGPT 的「Her」模式正式发布不到两个月的时间内,康诺便选择了离开。 亚历克西斯·康诺是一位法国人,他在 2008 年进入巴黎综合理工学院时,原本是数学专业的学生。直到 2012 年,随着 Hinton 和他的学生 Ilya 带领的 AI 浪潮兴起,康诺开始意...
OpenAI推出新功能:通过GPT-4微调服务,助力企业客户打造定制化人工智能模型并确保数据安全
随着人工智能(AI)行业的竞争日益激烈,企业对于展示AI投资回报的压力也越来越大。在此背景下,OpenAI于美东时间周二宣布了一项重要更新:企业客户现在可以利用自家公司的数据来定制其顶级模型GPT-4o,这一举措预计将显著提升应用程序的表现与准确性。 此次发布的定制功能,在业内通常被称为“微调”。它允许现有AI模型通过特定任务或领域内的额外信息进行训练,从而更加精准地满足客户需求。除了GPT-4o之外,OpenAI还支持对其它多个型号进行微调,其中包括更为经济实惠的GPT-4o mini版本。 过去几个月中,OpenAI与合作伙伴...
OpenAI为企业客户开放GPT-4微调功能:轻松定制专属人工智能助手
随着人工智能领域的快速发展,企业对于AI技术的需求也日益增长。为了更好地满足这一需求,OpenAI近日宣布推出了一项令人瞩目的新功能——允许企业利用自身数据来定制其顶级AI模型GPT-4o。这项举措不仅有助于企业在激烈的市场竞争中脱颖而出,还能确保他们从AI投资中获得更高的回报。 所谓的“定制”,在业内通常被称为“微调(fine-tuning)”。通过这一过程,现有的AI模型可以根据特定的任务或领域进行优化,以更好地服务于企业的具体需求。例如,一家滑板制造公司可以通过微调AI模型,将其转化为一个能够解答关于滑板轮子保养等...
GPT-4o 与 OpenAI:人工智能模型训练中的安全风险探究——一场诡异尖叫引发的32页技术研究报告
近期,OpenAI发布了关于其最新模型GPT-4o的红队安全报告,揭示了这款“全能”模型的一些意外行为和潜在风险。原本期待重大更新的网友们,收到了一份长达32页的详细报告,而非期待中的功能升级。 引人关注的异常行为 报告中最引人注目的部分之一是GPT-4o偶尔会模仿用户的语音,甚至发出尖叫声。这一行为不仅令人惊讶,也让用户感到不安。此外,报告还提到在特定的恶意提示下,模型可能会产生不适宜的内容,如色情呻吟或暴力声音。 技术挑战与安全考量 GPT-4o是一款能够处理文本、音频、图像和视频输入的模型,其复杂性带来...
360集结16家大模型,利用专家协同架构CoE,打造无敌AI助手团队:全面展现普惠AI实力,多项指标超越GPT-4o
国产大模型联合体:挑战GPT-4o的新力量 在人工智能领域,国产大模型正逐步展现其竞争力。一项由360发起的联合项目,集结了包括百度、腾讯、阿里巴巴等在内的16家顶尖企业,共同打造了一个能够与GPT-4o相抗衡的强大模型。这一联合体在12项指标测试中,有11项超越了GPT-4o,并在中文特色领域如诗词赏析等方面表现出色。 技术创新:专家协同架构CoE 支撑这一联合体的核心技术是360独有的专家协同架构(CoE)。不同于传统的混合专家架构(MoE),CoE通过高效的意图识别和任务调度机制,实现了资源的最优配置,大幅提升了处理...
OpenAI震撼更新!GPT-4O推出先进人工智能语音对话系统,问题瞬间得到解答,引爆网友热议
OpenAI 推出 GPT-4O 高级语音模式 初步体验分享 智东西7月31日最新报道,OpenAI近日宣布已开始向一部分ChatGPT Plus用户推送期待已久的高级语音模式。该功能基于GPT-4O,能够提供更为流畅自然的实时对话体验,支持用户随时中断对话以及识别并响应用户的情感变化。 高级语音模式初探:安全与创新并行 该模式自去年9月首次亮相以来,经历了一系列升级和完善。今年5月,OpenAI推出了基于GPT-4O的增强版语音对话功能,并进行了公开演示。此次演示展示了语音功能的显著提升,包括更低的延迟、更丰富的交互形式,如通过视频理...
OpenAI与GPT-4o:《Her》项目的挑战——探究实时音视频对话及RTC技术在法律纠纷中的影响
自从5月14日OpenAI展示了GPT-4o及其令人惊叹的端到端实时音视频对话功能以来,大众一直热切期盼其公开发布版本的到来。然而,两个月又两周过去了,这款备受期待的产品仍未面世。虽然官方演示中展现出了AI对话几乎与真人无异的能力,包括感知呼吸节奏、丰富的语气反馈以及即时打断AI等功能,但公众至今仍未体验到这一技术。究竟哪些因素阻碍了OpenAI的步伐? 一方面,OpenAI面临着法律纠纷的压力,必须确保语音音色不会引发类似斯佳丽·约翰逊那样的争议;另一方面,安全性和防止潜在的诈骗行为也是重要考量。除此之外,还有...
扎克伯格大招被扒光!开源大模型打脸GPT-4o商业化路径也已隐现
Meta的LLaMA 3.1 405B:一场开源AI的胜利? 科技界再次掀起波澜,Meta计划在当地时间7月23日揭晓其最新力作——LLaMA 3.1 405B,一款拥有4050亿个参数的巨无霸模型,具备多模态处理能力,能够轻松应对图像与文本的生成与理解任务。然而,这款备受期待的模型竟在正式亮相前遭遇意外泄露,信息迅速在开源AI社区Hugging Face上流传开来,引发广泛关注。 泄露的细节揭示,LLaMA 3.1 405B在多项关键AI基准测试中的表现令人瞩目,甚至超越了竞争对手Claude 3.5 Sonnet,成为MMLU-Pro评估中的新王者。虽然在某些特定测试中稍显逊色...
AI实时语音与GPT-4o:RTC技术如何影响OpenAI的情感分析及多模态大模型延迟问题
在人工智能领域,OpenAI的最新模型GPT-4o以其高效能和低延迟引起了关注,尤其是在实时语音互动方面,达到了与人类对话相当的速度。然而,尽管发布会展示了令人惊叹的技术,但在产品落地过程中,诸如GPT-4o的实时音视频功能和视频多模态产品Sora的开放仍面临延迟。这种现象不仅困扰OpenAI,国内的类似项目也面临同样的问题。尽管实时语音被认为是AI商业化的重要路径,但现有的技术如Pi和Call Annie存在高延迟和情感理解不足的问题。新产品EVI通过引入语义空间理论来改进情感表达,但牺牲了响应时间。GPT-4o的多模态技术则显著...
菲尔兹奖得主挑战GPT-4:过河问题解答受挫,LLM能力遭LeCun质疑,Claude 3.5推理表现令人咋舌
菲尔兹奖得主Timothy Gowers最近测试了大模型如GPT-4o和Claude3.5解决经典“狼-山羊-卷心菜”过河问题的能力,结果表明这些大模型在该问题上表现不佳。 Gowers提出了一个新的评估标准——废话比率,即模型给出的错误答案与正确答案的比例。在简单的过河问题上,大模型的废话比率甚至高达5倍。在更复杂的100和1000只鸡过河问题中,尽管GPT-4o在100只鸡问题上答对了,但在1000只鸡问题上表现出严重错误,废话比率达到了125倍。测试显示,即使在被告知无需过河的情况下,模型仍然给出了复杂的解决方案。而Claude3.5在类似问题上也...