• 2025-05-20 07:38:34
  • 阅读(4394)
  • 评论(17)
  • 近日,AI独角兽MiniMax稀宇极智公布新一代语音大模型Speech-02,宣告该模型在国际最权势巨子的两项语音评测榜单Artificial Analysis(全球知名AI基准测试机构)和Hugging Face TTS Arena (抱抱脸文本转语音竞技场)上,超出OpenAI、ElevenLabs等国际巨头,登上双榜榜首。

    国际权势巨子语音评测榜单Artificial Analysis 来源:以下图片均由Minimax方供应

    据引见,Speech-02在语音模型焦点技能指标:字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听客观评价反应也表现其更自然、真实。

    与Seed-TTS、CosyVoice 2和真实音频比拟,Speech-02在中英文的零样本语音克隆中均实现了更低的字错率(Word Error Rate, WER),注解其发音错误率更低且更清晰稳定。在SIM方面,Speech-02在全部24种测试语言中均明显优于ElevenLabs的multilingual_v2模型,前者生成的语音更逼近真人输入。

    展开剩余 31 %

    Hugging Face TTS Arena 评测榜单

    值得关注的是,Speech-02性能登顶的同时,其商用订价仅为全球头部语音模型ElevenLabs的四分之一,具有高性能和性价比双重优势。目前,MiniMax已在文旅导览、金融办事、语音助手、AI教育等领域应用其大模型办事。

    公布于:上海市
    8  收藏