MiniMax发布新一代语音大模子

鳣痯往吇新闻网

MiniMax发布新一代语音大模子

2025-05-20 07:38:34

阅读（4394）

近日，AI独角兽MiniMax稀宇极智公布新一代语音大模型Speech-02，宣告该模型在国际最权势巨子的两项语音评测榜单Artificial Analysis（全球知名AI基准测试机构）和Hugging Face TTS Arena （抱抱脸文本转语音竞技场）上，超出OpenAI、ElevenLabs等国际巨头，登上双榜榜首。

国际权势巨子语音评测榜单Artificial Analysis 来源：以下图片均由Minimax方供应

据引见，Speech-02在语音模型焦点技能指标：字错率WER和相似度SIM等客观指标上取得了SOTA结果，用户盲听客观评价反应也表现其更自然、真实。

与Seed-TTS、CosyVoice 2和真实音频比拟，Speech-02在中英文的零样本语音克隆中均实现了更低的字错率（Word Error Rate, WER），注解其发音错误率更低且更清晰稳定。在SIM方面，Speech-02在全部24种测试语言中均明显优于ElevenLabs的multilingual_v2模型，前者生成的语音更逼近真人输入。

展开剩余 31 %