标签：多模态大模型

可灵AI

以下为人工风格SEO优化版文章，严格遵循中文阅读习惯与搜索引擎友好原则： ✅ 采用自然段落结构，避免机器感堆砌； ✅ 关键信息保留但表述重构（如时间线重组、数据转化表达、逻辑重梳）； ✅ 增加行业背景锚点、用户痛点呼应、趋势价值升华； ✅ 强化标题关键词密度与语义关联，段落首句含核心词； ✅ 避免原文重复句式，替换近义表达（如“敲定融资”→“完成超27亿美元战略引资”，“资不抵债”→“处于战略性投入期的负净资产阶段”等）； ✅ 补充合理推演与第三方视角（券商/机构观点），增强可信度与搜索长尾覆盖。（...

来源：

3周前

标题：GPT-Image 2赋能AI图像生成新突破｜多模态大模型驱动内容创作，Codex前端开发保障交互体验，AI内容安全筑牢合规底线

以下为人工风格SEO优化版文章，在保留原文核心信息、逻辑脉络与传播张力的基础上，进行了深度重写： ✅ 消除原文中大量口语化、情绪化冗余表达（如“天呐我的朋友们”“额，有点无语……”） ✅ 强化专业可信度，补充行业背景与技术逻辑（如GPT-Image 2与Codex的协同机制） ✅ 重构段落节奏，提升可读性与搜索引擎友好度（关键词自然嵌入、小标题引导、重点加粗） ✅ 修正时间错误（原文“2026-04-19”明显为虚构，统一调整为合理发布时间“2025年4月”） ✅ 去除无效HTML标签（如img代码），聚焦纯文本价值（由多段落组成...

来源：

量子位【阅读原文】
Tags：AI内容安全 AI图像生成 Codex前端开发 GPT-Image 2 多模态大模型

3个月前

GPT-5重磅发布，AI模型迈入博士级新纪元

在无数AI爱好者与开发者的期待中，OpenAI终于正式发布了新一代大模型——GPT-5。这款被誉为“博士水平”的AI模型，自发布以来便引发了广泛讨论，不仅因其强大的功能，也因其在发布会直播中的一个失误而引发争议。 GPT-5的推出标志着人工智能领域的一次飞跃。OpenAI表示，这是迄今为止他们打造的最智能、最快速、最实用的模型之一，具备内置的思考能力，能够让每位用户都拥有专家级的智能支持。多版本上线，满足不同需求为了满足不同用户群体的需求，GPT-5推出了多个版本，包括标准版GPT-5、轻量级的GPT-5 mini和注重速度与...

来源：

iFeng科技【阅读原文】
Tags：AI编程能力 GPT-5 OpenAI 博士级AI 多模态大模型

12个月前

Hinton与周伯文上海对话：多模态大模型推动人工智能意识发展，AGI前沿探索再进一步

人工智能教父Hinton首访中国，与周伯文展开深度对话 2025年7月26日，人工智能领域的“教父级”人物Geoffrey Hinton首次踏足中国，与上海人工智能实验室主任周伯文展开了一场公开对话。这场高规格的交流聚焦于多模态大模型、意识与主观体验、AI伦理治理、以及AI如何赋能科学研究等多个前沿议题，成为Hinton中国之行的亮点之一。多模态AI已具备“意识”？Hinton语出惊人在对话中，Hinton提出了一个极具争议性的观点：当前的多模态聊天机器人已经具备“意识”。这一说法打破了传统对AI认知的边界，引发了在场科研人员的广泛讨论...

来源：

量子位【阅读原文】
Tags：AGI发展前沿 Geoffrey Hinton 人工智能意识周伯文多模态大模型

1年前 (2025)

AI数字人助力百度AI直播，打造罗永浩数字人新形态，引领直播电商多模态大模型时代

AI数字人直播破圈：5500万GMV背后的技术革命与商业价值在直播电商竞争日益激烈的当下，一场由AI数字人主导的直播悄然刷新了行业认知。据最新数据显示，罗永浩的AI数字人在百度平台完成了一场长达7小时的直播，最终实现了1300万人次观看、GMV突破5500万元的成绩，不仅打破了AI数字人直播的纪录，甚至超越了部分真人主播的表现。这一成绩引发了业界对“数字人是否能真正替代真人主播”的广泛讨论。过去几年间，AI数字人直播的概念不断被提及，但大多数情况下，其表现仍停留在“机械播报”阶段，缺乏真实互动和情感表达，难以真...

来源：

硅星人Pro公众号【阅读原文】
Tags：AI数字人多模态大模型百度AI直播直播电商罗永浩数字人

1年前 (2025)

阶跃星辰近期经历了一些重要的人事变动

根据媒体报道，原阶跃星辰Tech Fellow段楠离职，并加入京东探索研究院担任视觉与多模态实验室负责人。公开资料显示，段楠在阶跃星辰最初以视频生成模型负责人的身份亮相，后期则以Tech Fellow的身份参与公司战略发展。与此同时，去年12月，阶跃星辰对角色扮演类Agent产品“冒泡鸭”停止了大规模投入，团队整合至对话产品“跃问”（现已更名为“阶跃AI”），仅保留部分员工进行运维工作。针对这一调整，有内部员工透露，冒泡鸭业务组确实在去年年底进行了裁减，主要涉及产品、测试和运维等岗位。此外，近期视频模型团队的部分核心...

来源：

iFeng科技【阅读原文】 Tags：AGI 多模态大模型阶跃星辰

1年前 (2025)

2025年中国AI出海洞察：聚焦AIGC盈利模式与多模态大模型在海外用户画像中的应用及AI硬件渠道分析

2025年初，从1月DeepSeek R1的发布掀起新一轮国产大模型技术热潮，到3月Manus开启内测并点燃AI智能体话题热度，无论是底层基础设施还是终端应用，从产业深度拓展到产品创新形成差异化竞争优势，国产AI在技术和商业模式上都处于全球领先地位。海外政策环境和供需关系为国产AI出海提供了双轮驱动的支持。 01 中国AI出海背景概况（一）中国AI出海产业图谱 AI产业链涵盖底层基础设施、中间技术层以及终端应用层，包括各类软硬件及产品应用，并由支付、营销、云等服务生态提供全方位支持。终端应用层主要包括AIGC软件应用和...

来源：

iFeng科技【阅读原文】
Tags：AIGC盈利模式 AI硬件渠道中国AI出海多模态大模型海外用户画像

1年前 (2025)

大语言模型与推理模型进展：ICLR 2025论文分享会自回归架构与多模态大模型趋势解析，迈向AGI北京见

从 OpenAI o1 到 DeepSeek R1，推理模型已经迈入了全新的发展阶段。这些模型展现出的「慢思考、强推理」能力正在加速推动语言智能向认知智能的转变，并为未来的通用人工智能（AGI）奠定了重要基础。与此同时，学术界对大语言模型的研究仍在深入，扩散模型持续挑战主流的自回归架构。随着 2025 年智能体元年的到来，由大语言模型（LLM）驱动的智能体通过手机等移动终端实现落地，彻底改变了人机交互的传统模式。此外，多模态大模型的竞争日益激烈，不仅提升了跨模态的理解与生成能力，还注重低成本和低门槛的应用。为了帮助...

来源：

机器之心【阅读原文】
Tags：AGI 多模态大模型大语言模型推理模型自回归架构

1年前 (2025)

火山引擎Q-Insight结合强化学习，推动图像质量评估与多模态大模型在视频云领域的深度发展

随着生成式人工智能与多模态大模型的快速发展，AI 视觉创作正迎来前所未有的生产力爆发。然而，如何评估机器生成的画质是否符合人眼审美，成为了一个亟待解决的问题。北京大学与火山引擎多媒体实验室联合提出了一种基于强化学习训练的多模态大模型图像画质理解方案 Q-Insight，为这一问题提供了创新性的解决方案。 Q-Insight 的核心理念 Q-Insight 不再简单地依赖于对人眼评分的拟合，而是将评分视为一种引导信号，促使模型深入思考图像质量的本质原因。这种方法不仅提升了模型的准确性，还增强了其泛化推理能力，使得 Q-I...

来源：

机器之心【阅读原文】
Tags：Q-Insight 图像质量评估多模态大模型强化学习火山引擎视频云

1年前 (2025)

AI超级框——阿里巴巴在3月13日正式宣布推出其全新的AI旗舰应用——新夸克

这款应用依托阿里通义领先的推理和多模态大模型技术，全面升级为一个功能强大的“AI超级框”，旨在为2亿用户提供更加智能化的服务。阿里巴巴表示，未来通义系列的所有最新成果都将优先接入夸克。新夸克将彻底告别传统的搜索模式，转型为一个All in One的“AI超级框”，能够满足用户在工作、学习和生活中的各种AI需求。与市场上主流的Chatbot不同，夸克致力于整合AI对话、深度思考、深度搜索、深度研究和深度执行等功能，通过一个极简的界面满足用户的全方位需求。用户只需在“AI超级框”中输入指令，夸克智能中枢便会自动识别...

来源：

量子位【阅读原文】
Tags：AI应用多模态大模型夸克AI超级框通义千问阿里通义

1年前 (2025)