段落一:
智东西(公众号:zhidxcom)报道,作者ZeR0和编辑漠影共同完成了一篇关于国内大模型“六小虎”之一的深度解析文章。6月21日凌晨,上海AI大模型独角兽MiniMax正式推出了其MiniMax Week的压轴产品——语音设计工具。这一工具由MiniMax最新研发的语音设计模型提供技术支持。
段落二:
在MiniMax Audio界面上,用户可以通过输入任意提示词到“Prompt”文本框中,生成具有不同声音、情感特征的语音,从而实现完全可定制化服务。此外,该工具支持多种语言选择。下方的“Text to Preview”文本框允许用户输入最多300个字符的,用于生成相应的语音片段,不过目前生成的语音时长仍有一定限制。
段落三:
通过点击生成按钮,系统将一次性生成3段符合用户需求但音色、语气和节奏略有差异的语音样本。如果对这些样本满意,用户可以选择其中一个进入语音注册页面;若不满意,也可以重新生成新的语音选项。在语音注册页面,用户需要填写语音名称,并选择语音性别及语种,当前支持的语种包括英文和中文普通话。
段落四:
完成保存操作后,用户将进入语音库界面,在这里可以一键复制并分享已生成语音的链接。同时,用户还可以点击“Use”按钮,进入语音合成页面进行进一步编辑。在语音合成页面,用户可以选择不同的模型和语言设置,最多支持输入5000个字符以生成更长的语音。
段落五:
MiniMax展示了几个生成语音的示例,例如输入“粗暴的海盗船长”、“性感且带有气息的女声”或“狡猾的小妖精”,都能生成符合描述要求的高质量语音效果。此外,用户还可以输入更加详细的描述信息,如“一位年轻的朋友以轻松愉快的方式分享”、“带着一丝担忧关心的年轻朋友”或“充满八卦好奇心的年轻女性”等,以获得更加个性化的声音表现。
段落六:
每位用户可以免费使用该功能三次,如果需要更多使用次数或将MiniMax Audio应用于商业用途,则需要订阅付费服务。至此,MiniMax为期五天的“发布周”圆满结束,前四项发布回顾如下:
– 6月17日周二:开源456B推理模型,并公开技术报告。
– 6月18日周三:推出视频大模型海螺02。
– 6月19日周四:发布通用智能Agent:MiniMax Agent。
– 6月20日周五:推出端到端视频创作Agent:海螺视频Agent。
