MiniMax Audio推出强大语音设计工具，基于AI大模型实现商业用途的高效语音合成

每日AI快讯1年前 (2025)发布 AI部落小助手

段落一：
智东西（公众号：zhidxcom）报道，作者ZeR0和编辑漠影共同完成了一篇关于国内大模型“六小虎”之一的深度解析文章。6月21日凌晨，上海AI大模型独角兽MiniMax正式推出了其MiniMax Week的压轴产品——语音设计工具。这一工具由MiniMax最新研发的语音设计模型提供技术支持。

段落二：
在MiniMax Audio界面上，用户可以通过输入任意提示词到“Prompt”文本框中，生成具有不同声音、情感特征的语音，从而实现完全可定制化服务。此外，该工具支持多种语言选择。下方的“Text to Preview”文本框允许用户输入最多300个字符的，用于生成相应的语音片段，不过目前生成的语音时长仍有一定限制。

段落三：
通过点击生成按钮，系统将一次性生成3段符合用户需求但音色、语气和节奏略有差异的语音样本。如果对这些样本满意，用户可以选择其中一个进入语音注册页面；若不满意，也可以重新生成新的语音选项。在语音注册页面，用户需要填写语音名称，并选择语音性别及语种，当前支持的语种包括英文和中文普通话。

段落四：
完成保存操作后，用户将进入语音库界面，在这里可以一键复制并分享已生成语音的链接。同时，用户还可以点击“Use”按钮，进入语音合成页面进行进一步编辑。在语音合成页面，用户可以选择不同的模型和语言设置，最多支持输入5000个字符以生成更长的语音。

段落五：
MiniMax展示了几个生成语音的示例，例如输入“粗暴的海盗船长”、“性感且带有气息的女声”或“狡猾的小妖精”，都能生成符合描述要求的高质量语音效果。此外，用户还可以输入更加详细的描述信息，如“一位年轻的朋友以轻松愉快的方式分享”、“带着一丝担忧关心的年轻朋友”或“充满八卦好奇心的年轻女性”等，以获得更加个性化的声音表现。

段落六：
每位用户可以免费使用该功能三次，如果需要更多使用次数或将MiniMax Audio应用于商业用途，则需要订阅付费服务。至此，MiniMax为期五天的“发布周”圆满结束，前四项发布回顾如下：

– 6月17日周二：开源456B推理模型，并公开技术报告。
– 6月18日周三：推出视频大模型海螺02。
– 6月19日周四：发布通用智能Agent：MiniMax Agent。
– 6月20日周五：推出端到端视频创作Agent：海螺视频Agent。

本文来源：