OpenAI发布实时API:语音技术合作伙伴Agora与Twilio强势加盟GPT-4时代

OpenAI 发布实时 API 语音合作伙伴,Agora 和 Twilio 榜上有名 近日,OpenAI 宣布推出实时 API 的公开测试版,旨在帮助开发者构建基于 GPT-4 的语音到语音 AI 应用程序和智能代理。这一新功能允许所有付费用户在自己的应用程序中创建低延迟、多模态的实时互动体验。此外,Open...

【创新突破】ECCV 2024奖项揭晓:哥伦比亚大学荣膺最佳论文奖,微软COCO数据集再创经典——聚焦计算机视觉领域的前沿进展与创新方法

ECCV 2024 在意大利米兰开幕 近日,计算机视觉领域的顶级会议之一——ECCV 2024(European Conference on Computer Vision)在意大利米兰隆重开幕。根据大会官方统计,今年共有 2395 篇论文被录用,录用率仅为 18%,创下近年来的新低。在开幕式上,大会公布了多个重要奖项,包括...

OpenAI开发者大会揭晓四大革新:实时API与视觉微调引领未来,提示词缓存技术降低50%输入token成本

10月2日的消息显示,OpenAI于美东时间10月1日在年度开发者大会DevDay上发布了一系列创新工具。这些新工具包括实时API、视觉微调、提示词缓存及模型蒸馏四大亮点,旨在帮助开发者降低模型成本、提升视觉理解能力和语音AI功能,并改善小模型的性能。 实时API(Realtime API) ...

Liquid AI:采用自注意力机制与Transformer架构的LFM模型,展示出卓越的数据处理能力,性能超越Meta Llama及微软Phi

IT之家报道,近日,成立于去年的Liquid AI公司发布了一系列全新的基础模型——Liquid Foundation Models(LFM)。这批模型包括LFM-1.3B、LFM-3.1B和LFM-40.3B三个版本。这些模型采用了不同于传统Transformer架构的设计,宣称在多项基准测试中表现优异。 目前,Transformer架构在...

Cerebras Systems:AI芯片领域的独角兽凭借WSE-3技术申请IPO,挑战英伟达,尽管两年净亏21亿

AI芯片初创企业Cerebras Systems提交IPO申请 AI芯片初创企业Cerebras Systems近日正式提交了IPO申请,计划在纳斯达克上市,股票代码为“CBRS”。这家公司成立于2016年4月,总部位于美国加州,以其独特的晶圆级引擎(WSE)而著称。Cerebras Systems不仅专注于AI训练和推理芯片的设计,还在云端服务领域取得了显著进展。 WSE-3芯片与竞争对手的对比 Cerebras Systems的WSE-3芯片在性能上远超竞争对手。例如,与英伟达的H100 GPU相比,WSE-3的核心数量是H100的52倍,片上内存是H100的880倍,内存带宽更是H100的7000倍。此外,C...

提升工作效率与体验!深入探索Windows 11的24H2及LTSC版本发布:全新AI功能、优化文件资源管理器、支持Wi-Fi 7及增强节能模式带来的一系列实用改进!

微软正式发布 Windows 11 2024 更新(24H2) 据快科技报道,微软于10月2日正式推出了全新的 Windows 11 2024 更新 (版本号为26100.1742)。此次更新不仅带来了许多实用的新功能,还在开始菜单、文件资源管理器和设置等方面进行了改进。 24H2 版本引入了多项 AI 功能 新版本...

OpenAI为开发人员开启语音AI引擎时代:深入探讨ChatGPT与Twilio API的应用

近日,鞭牛士报道了OpenAI的一项重大举措。该公司宣布将向其他开发人员开放其语音AI引擎,这一引擎正是ChatGPT高级语音模式的核心技术。这意味着开发人员现在可以实时访问这项技术,使AI能够理解和处理语音命令,并在类似通话的场景中进行语音交流。 此前,实现这一功能需要经...

AMD发布AMD-135M:开源小型语言模型通过推测解码实现性能提升3.88倍

AMD发布首款小型语言模型AMD-135M 10月1日,快科技报道,AMD正式发布了其首款小型语言模型(SLM),命名为“AMD-135M”。相较于当前日益庞大的大型语言模型(LLM),这款小型语言模型体积更小、灵活性更高,并且具有更强的专业性和隐私保护能力,非常适合企业内部部署。 AMD-13...

国防科大提出灵巧手抓取策略迁移新方案:智能图形学与Transformer助力泛化能力提升

本文介绍的是国防科技大学智能图形计算团队在智能图形学、具身智能、机器学习及三维视觉等方面的研究成果。该团队拥有众多国家级人才,长期致力于数据驱动三维感知、建模与交互的研究,并在国际上发表了大量高质量论文,荣获多个奖项。 在机器人操作领域,抓取任务一直是核心...

科大讯飞与字节跳动迎战GPT-4:端到端大模型引领语音AI技术革新与生死挑战

引言 最近,OpenAI 推出了 GPT-4 的高级语音功能,引发了新一轮的关注。这项功能不仅提升了语音交互的真实感,还加入了多种新特性,如自定义指令、记忆功能以及五种新声音。更重要的是,GPT-4 的语音交互变得更加自然,用户可以在任何时候打断对话,即便不说话时,系统也会保持...