每日AI快讯

OpenAI 推出 GPT-4 高级语音模式:教育应用领域的创新尝试 – 日日新5.5

OpenAI最近宣布了一项备受瞩目的测试计划,将面向一小部分ChatGPT Plus用户推出GPT-4的高级语音模式。此次测试旨在收集关于安全性和功能性的反馈,以进一步完善该技术。预计到8月初,OpenAI将会公布一份详尽的GPT-4评估报告。除了语音模式外,后续还将推出视频和屏幕共享等功能。获得测试资格的用户将通过电子邮件接收通知。一位专注于人工智能领域的专栏作家有幸成为首批试用者之一。他尝试让GPT-4模拟足球解说员的角色,在关键时刻以充满激情的语调进行解说,尽管初次尝试并未完全达到预期,但经过调整后的表现令人印象深...

Sora AI视频生成技术:大厂与创企的商业化探索之路 — Diffusion Model与Transformer的应用

自从Sora在今年2月发布以来,国内的AI视频生成赛道迅速升温,各大企业和初创公司纷纷加入竞争行列。Sora以其出色的视频生成能力和长达一分钟的视频展示,引领了行业潮流。紧随其后,国内企业如字节跳动、快手、商汤、阿里达摩院等相继推出了自己的AI视频生成工具。这些工具不仅吸引了大量用户的关注,还推动了技术的快速迭代。 技术架构与创新 Sora的成功激发了其他公司对Diffusion Model和Transformer架构的深入研究。这两种技术路径各有千秋,而Sora创造性地将两者结合,形成了DiT(Diffusion + Transformer)架构,显...

天风证券:以旧换新补贴加速人工智能个人电脑渗透率,EC芯片与触控芯片驱动消费品更新,产业链投资前景可期

随着7月31日的消息传来,天风证券发布的研究报告强调了一个重要的市场趋势:通过加大对于大规模设备更新以及旧产品置换新产品的支持力度,可能会显著促进人工智能个人电脑(AI PC)市场的普及率,并为相关的产业带来新的投资机遇。 在当前各大电脑制造商纷纷推出自家的人工智能个人电脑之际,政府层面的旧产品置换新产品的补贴政策有望进一步刺激消费者的购买欲望,推动AI PC市场的快速发展。这种趋势不仅限于产品销售的增长,更重要的是将带动整个产业链的繁荣,包括但不限于EC芯片与触控芯片等关键组件供应商。

Perplexity与出版商达成协议:深入了解AI搜索公司的广告收入分成及企业专业版服务 – Scalepost.ai

近期,AI搜索领域的新兴势力——Perplexity公司在遭遇数据抓取争议后,迅速调整策略,推出了一项旨在与出版商共享收益的合作计划。此举不仅展现了公司在面对挑战时的灵活性,也为出版行业带来了全新的合作模式。 据可靠消息称,Perplexity已成功吸引了首批重量级合作伙伴加入其“出版商计划”,包括知名媒体如《时代》杂志、《明镜周刊》、《财富》杂志、《企业家》杂志、《得克萨斯论坛报》,以及科技巨头Automattic(旗下的WordPress.com参与其中,但不涉及Tumblr)。通过这一计划,当Perplexity在回应用户的查询请求时引用这...

黄仁勋透露首批Blackwell已问世:英伟达AI芯片助力生成式AI发展,企业元宇宙标配——AI助手

在最近举办的SIGGRAPH大会中,英伟达首席执行官黄仁勋宣布了一个重要的里程碑:新一代人工智能芯片Blackwell的工程样片已经送达全球合作伙伴手中。与此同时,他与Meta公司的创始人兼首席执行官马克·扎克伯格进行了一场深入而富有洞察力的对话。 AI芯片Blackwell及其背后的技术 Blackwell芯片的研发过程中,人工智能技术扮演了至关重要的角色。黄仁勋在会上不仅展示了这款芯片的强大性能,还分享了英伟达在AI领域的多项突破性进展,包括基于OpenUSD的生成式AI模型、Edify AI模型,以及Omniverse平台在3D增强生成方面的能力...

OpenAI震撼更新!GPT-4O推出先进人工智能语音对话系统,问题瞬间得到解答,引爆网友热议

OpenAI 推出 GPT-4O 高级语音模式 初步体验分享 智东西7月31日最新报道,OpenAI近日宣布已开始向一部分ChatGPT Plus用户推送期待已久的高级语音模式。该功能基于GPT-4O,能够提供更为流畅自然的实时对话体验,支持用户随时中断对话以及识别并响应用户的情感变化。 高级语音模式初探:安全与创新并行 该模式自去年9月首次亮相以来,经历了一系列升级和完善。今年5月,OpenAI推出了基于GPT-4O的增强版语音对话功能,并进行了公开演示。此次演示展示了语音功能的显著提升,包括更低的延迟、更丰富的交互形式,如通过视频理...

Meta开源『Segment Anything Model 2』:SAM 2实现图像与视频全方位分割技术

Meta发布Segment Anything Model 2 (SAM 2),引领图像与视频分割技术新纪元 去年四月,Meta推出颠覆性的“分割一切”模型,引起了业界广泛关注。如今,Meta再次引领潮流,推出了Segment Anything Model 2 (SAM 2)。这款全新模型在原有基础上实现了重大突破,能够实现实时、可提示的对象分割,适用于静态图像和动态视频内容。SAM 2的强大之处在于它可以无缝处理图像和视频,甚至能够分割之前未曾见过的对象和视觉域,极大地拓展了应用场景。 SAM 2的技术革新与卓越性能 SAM 2采用了创新的流式内存设计,能够按顺序高效处理...

AI视频生成平台评比:Odyssey, Dreamflare, Fable Studio — 谁将引领好莱坞级别视觉效果的未来趋势?

AI时代的视频创作:探索好莱坞级别的视觉盛宴 随着AI技术的迅猛发展,视频创作领域正经历一场前所未有的变革。Odyssey、Dreamflare以及Fable Studio等初创公司正积极探索AI视频生成的新边界,力求打造好莱坞级别的视觉体验。 Odyssey,一家专注于构建好莱坞级别视觉AI视频生成模型的公司,正致力于通过强大的底层模型实现高质量视频的自动化生产。其核心技术团队来自于自动驾驶领域,这种跨界背景使得他们能够将自动驾驶技术中的三维世界理解能力应用于视频生成中。Odyssey不仅关注视频的质量,还重视用户对视频创作过程的...

英伟达NVIDIA NIM:几分钟内构建AI应用的全新升级工具 – NVIDIA, AI, 生成式人工智能, OpenUSD

NVIDIA 在 SIGGRAPH 2024 的重大突破 在备受瞩目的计算机图形学会议 SIGGRAPH 2024 上,NVIDIA 展示了其在渲染、仿真与生成式人工智能领域的最新成果。其中,最令人瞩目的无疑是 NVIDIA NIM 平台的全面升级。 NVIDIA NIM:AI 创新的加速器 NVIDIA NIM 是英伟达为应对生成式 AI 时代挑战而推出的关键平台。它允许用户在极短的时间内构建 AI 应用程序,极大地简化了从模型开发到部署的整个流程。英伟达创始人兼CEO 黄仁勋将其形象地称为“AI-in-a-Box”,意味着用户可以通过标准化的流程轻松部署复杂的 AI 模型,进一步提升...

腾讯量子实验室联合医图生科发布药物设计新突破:运用量子计算与混合编程框架的时代来临

量子计算开启药物设计新篇章:腾讯与医图生科共创未来 近期,医图生科携手腾讯量子实验室,联合中国药科大学和宁波工程学院,共同发表了题为《A hybrid quantum computing pipeline for real world drug discovery》(面向真实世界药物发现的混合架构量子计算框架)的论文。该研究不仅标志着药物设计领域进入了一个崭新的时代,同时也预示着量子计算在医药行业中的潜在影响力。研究团队成功构建了一个结合经典与量子计算的混合编程框架,并将其应用于两个真实的药物设计案例中,证实了量子计算在此领域的巨大潜力。 经典...