标题建议（符合SEO优化，包含关键词，字数符合要求）：

以下是根据您提供的原始，经过人工风格整理后的SEO优化文章，结构清晰、关键词自然融入，更符合搜索引擎优化需求。

微软AI发布首批自研大模型，语音生成模型引发关注

近日，微软旗下的AI研究机构微软AI（Microsoft AI，简称MAI）正式发布了其首批自主研发的大规模人工智能模型，包括基础模型MAI-1-preview和语音生成模型MAI-Voice-1。这一系列动作标志着微软在AI基础模型领域迈出了关键一步。

其中，MAI-Voice-1语音模型的发布恰逢其会，正值OpenAI也在同一天推出其语音模型。MAI-Voice-1具备高保真、富有表现力的音频生成能力，目前已在Copilot Daily和Podcasts上线，并可通过Copilot Labs进行体验。

在实测过程中，这款语音模型展现出极高的可定制性。用户不仅可以选择不同的情绪模式和声音模板，还可从超过40种语体风格中进行挑选。除了常规的喜悦、愤怒、悲伤等情绪模板，模型还支持扮演机器人、海盗、吸血鬼、新闻主播、猫头鹰等角色，为文本赋予多样化的演绎风格。

每个角色都有独特的语言习惯和口癖。例如，猫头鹰会不断发出“咕咕”声，机器人则带有一种“机械感”，而新闻主播则显得专业且严肃。这些角色均基于统一的声音模板构建，展现出模型强大的可塑性与表现力。

值得一提的是，MAI-Voice-1的生成速度也非常快，微软官方表示其可在单块GPU上运行，每秒生成一分钟的音频。不过目前该模型尚不支持中文输出，输入中文文本时将自动转换为英文。

体验链接：
https：//copilot.microsoft.com/labs/audio-expression

MAI-1-preview：面向通用任务的混合专家模型

另一款发布的模型MAI-1-preview是一款混合专家模型（MoE），在大约15000块英伟达H100 GPU上完成了预训练和后训练。该模型专注于指令遵循和日常问题解答能力，已经在LMArena（大模型竞技场）内进行盲测，但目前尚未全面开放体验。

据悉，未来几周内MAI-1-preview将逐步应用于Copilot的部分文本场景，以收集用户反馈并优化体验。微软AI CEO Mustafa Suleyman在接受媒体采访时也透露，这款模型将作为“人格原材料”，为未来打造多种人格化AI产品提供基础。

Mustafa Suleyman专访：AI是微软未来的核心

在模型发布之际，Mustafa Suleyman接受了深度专访，分享了微软AI自研模型的战略思路，并回应了外界关于微软与OpenAI关系变化的猜测。

Suleyman强调，AI对微软的未来具有根本性意义，自研模型的计划早在14个月前就已经启动。他指出，虽然微软将继续与OpenAI等公司合作，但拥有自主可控的模型技术至关重要。

关于模型的未来应用，Suleyman表示，通过后训练和提示词工程，MAI-1-preview可以演化出“数百万种人格”，从而适配不同产品和用户需求。他同时指出，模型本身是“空心”的，其能力源于对大量数据的模仿学习，而非真正的意识或体验。

高效训练：规模不是唯一关键

在谈及训练资源时，Suleyman提到，微软正在建设全球最大的GB200和GB300 GPU集群之一，用于支持OpenAI、MAI以及第三方推理服务。尽管微软使用的15000块H100 GPU在行业规模中并不算最大，但Suleyman表示，微软已证明通过高效的数据筛选和训练策略，可以在更小的算力投入下实现世界级性能。

他强调，训练模型的关键在于数据质量而非数量，避免在无意义token上浪费计算资源。这种高效训练理念，也是微软AI团队在短时间内取得突破的重要原因之一。

招聘与未来规划：人才与技术并重

在人才招聘方面，Suleyman表示，微软AI团队已从Inflection AI等机构引入大量顶尖人才，团队规模正稳步扩大。他指出，真正吸引人才的是微软AI在技术落地、产品创新和影响力方面的优势。

此外，Suleyman也透露，微软正在开发下一版本模型MAI-2，规模将更大，并在训练方法上有所创新。他表示，未来几个月乃至几年内，微软AI将推出更多令人期待的产品和技术。

关于模型是否开源的问题，Suleyman表示目前暂未开放，但未来不排除开源的可能性。他强调，微软将保持开放态度，持续评估模型在产品中的表现和用户反馈，再决定是否对外共享。

本文来源：