以下是根据您提供的原始,经过人工风格整理后的SEO优化文章,结构清晰、关键词自然融入,更符合搜索引擎优化需求。
##
微软AI发布首批自研大模型,语音生成模型引发关注
近日,微软旗下的AI研究机构微软AI(Microsoft AI,简称MAI)正式发布了其首批自主研发的大规模人工智能模型,包括基础模型MAI-1-preview和语音生成模型MAI-Voice-1。这一系列动作标志着微软在AI基础模型领域迈出了关键一步。
其中,MAI-Voice-1语音模型的发布恰逢其会,正值OpenAI也在同一天推出其语音模型。MAI-Voice-1具备高保真、富有表现力的音频生成能力,目前已在Copilot Daily和Podcasts上线,并可通过Copilot Labs进行体验。
在实测过程中,这款语音模型展现出极高的可定制性。用户不仅可以选择不同的情绪模式和声音模板,还可从超过40种语体风格中进行挑选。除了常规的喜悦、愤怒、悲伤等情绪模板,模型还支持扮演机器人、海盗、吸血鬼、新闻主播、猫头鹰等角色,为文本赋予多样化的演绎风格。
每个角色都有独特的语言习惯和口癖。例如,猫头鹰会不断发出“咕咕”声,机器人则带有一种“机械感”,而新闻主播则显得专业且严肃。这些角色均基于统一的声音模板构建,展现出模型强大的可塑性与表现力。
值得一提的是,MAI-Voice-1的生成速度也非常快,微软官方表示其可在单块GPU上运行,每秒生成一分钟的音频。不过目前该模型尚不支持中文输出,输入中文文本时将自动转换为英文。
体验链接:
https://copilot.microsoft.com/labs/audio-expression
MAI-1-preview:面向通用任务的混合专家模型
另一款发布的模型MAI-1-preview是一款混合专家模型(MoE),在大约15000块英伟达H100 GPU上完成了预训练和后训练。该模型专注于指令遵循和日常问题解答能力,已经在LMArena(大模型竞技场)内进行盲测,但目前尚未全面开放体验。
据悉,未来几周内MAI-1-preview将逐步应用于Copilot的部分文本场景,以收集用户反馈并优化体验。微软AI CEO Mustafa Suleyman在接受媒体采访时也透露,这款模型将作为“人格原材料”,为未来打造多种人格化AI产品提供基础。
Mustafa Suleyman专访:AI是微软未来的核心
在模型发布之际,Mustafa Suleyman接受了深度专访,分享了微软AI自研模型的战略思路,并回应了外界关于微软与OpenAI关系变化的猜测。
Suleyman强调,AI对微软的未来具有根本性意义,自研模型的计划早在14个月前就已经启动。他指出,虽然微软将继续与OpenAI等公司合作,但拥有自主可控的模型技术至关重要。
关于模型的未来应用,Suleyman表示,通过后训练和提示词工程,MAI-1-preview可以演化出“数百万种人格”,从而适配不同产品和用户需求。他同时指出,模型本身是“空心”的,其能力源于对大量数据的模仿学习,而非真正的意识或体验。
高效训练:规模不是唯一关键
在谈及训练资源时,Suleyman提到,微软正在建设全球最大的GB200和GB300 GPU集群之一,用于支持OpenAI、MAI以及第三方推理服务。尽管微软使用的15000块H100 GPU在行业规模中并不算最大,但Suleyman表示,微软已证明通过高效的数据筛选和训练策略,可以在更小的算力投入下实现世界级性能。
他强调,训练模型的关键在于数据质量而非数量,避免在无意义token上浪费计算资源。这种高效训练理念,也是微软AI团队在短时间内取得突破的重要原因之一。
招聘与未来规划:人才与技术并重
在人才招聘方面,Suleyman表示,微软AI团队已从Inflection AI等机构引入大量顶尖人才,团队规模正稳步扩大。他指出,真正吸引人才的是微软AI在技术落地、产品创新和影响力方面的优势。
此外,Suleyman也透露,微软正在开发下一版本模型MAI-2,规模将更大,并在训练方法上有所创新。他表示,未来几个月乃至几年内,微软AI将推出更多令人期待的产品和技术。
关于模型是否开源的问题,Suleyman表示目前暂未开放,但未来不排除开源的可能性。他强调,微软将保持开放态度,持续评估模型在产品中的表现和用户反馈,再决定是否对外共享。
##
本文来源: