MiniMax海螺语音全球同步上线,文生音能力赶超ElevenLabs

大模型智能语音交互企业应用

继视频、文本模型家族在新年迎来新成员后,MiniMax带来了全新升级的T2A-01系列语音模型,并全球同步上线海螺语音产品。

与传统语音生成技术相比,全新升级的T2A-01系列语音模型不仅具有 音质稳定清晰、韵律自然、情绪精准表达、高准确度 等特点,提供 更快、更稳的语音生成能力 ,还能支持包括 中文、粤语、英语、日语、韩语、阿拉伯语、西班牙语在内的17种语言上百种预置音色 可选,为企业与个人用户提供自然流畅的语音生成体验。

目前,海螺语音对全球用户开放。AI合成语音的魅力,邀您一起探索。

海螺语音:

https:// hailuoai.com/audio

Hailuo Audio(海外版):

http s://hailuo.ai/audio

国内API服务:

https://platform.minimaxi.com/document/T2A%20V2

海外API服务:

https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643

picture.image

依托于T2A-01系列语音模型,用户在海螺AI仅需输入文字即可生成自然、流畅的超拟人人声, 最长可输入多达10000字符 。与此同时,用户可以根据需要自由配置输出语音的情绪、语速、音高,甚至调整音色效果,满足复杂场景的精细化需求。

多语种语言合成

综合能力可对标国际领军模型

海螺语音支持 中文、粤语、英语、日语、韩语、阿拉伯语、葡萄牙语、西班牙语、法语、意大利语、印尼语、荷兰语、俄语、德语、越南语、土耳其语、乌克兰语等17种语言 生成,能够提供真正地道的语言输出。在T2A-01模型的能力支持下,海螺语音在相似度、错误率和听感评测上均领先于同类产品。

我们用和Seed-TTS论文相同的评测集和评测工具(WER:合成音频的文本和asr识别结果计算词错率;SIM:用说话人识别工具计算合成音频和真实音频的距离,表示复刻相似度)来计算海螺语音的字错率和相似度(加粗数字评分代表更优结果)。结果显示, 海螺语音在中文的字错率和相似度最好,英文的字错率、相似度和真实录音「Human」接近。

picture.image

根据用户真实场景,我们建立了多语种评测集,并对17个语种进行客观评测。其中,每种语言选取2-10个音色,生成50条以上音频进行评估。 结果显示, 海螺语音相似度整体占优,综合能力媲美ElevenLabs。在中文、粤语、英语、日语、韩语和阿拉伯语等多个语种上,海螺语音的相似度、正确率方面大幅领先。

picture.image

试听demo:

韩语:안녕하세요, 음성 서비스를 제공해 드릴 수 있어서 기쁩니다. 마음에 드시는 목소리를 선택하시면 함께 멋진 음성 제작을 시작해보도록 하겠습니다.

译文:你好,很高兴为你提供配音服务。挑选你喜欢的声音,跟我们一起开启声音创作的精彩旅程。

粤语(绕口令):床脚撞墙角,墙角撞床角,你话床角撞墙角定墙角撞床脚?

译文:床脚撞墙角,墙角撞床脚,你说到底是床脚撞了墙角,还是墙角撞了床脚呢?

西班牙语:Siempre dicen que el tiempo cambia las cosas, pero en realidad, tú mismo tienes que cambiarlas. El tiempo solo te da las oportunidades, pero eres tú quien debe tomar las decisiones, hacer el esfuerzo y dar los pasos necesarios para transformar lo que no te gusta y crear la vida que realmente deseas.

译文:人们总是说时间会改变一切,但实际上,改变一切的应该是你自己。时间只是为你提供机会,但真正需要你做出决定、付出努力并迈出必要的步伐,去改变你不喜欢的东西,创造你真正渴望的生活的,是你自己。

日语:人生って、楽しむことが一番だよね!どんなに小さなことでも、楽しめるって思った瞬間から、素晴らしく感じられるんだ。

译文:人生中,最重要的就是享受生活!只要在任何时刻都能找到乐趣,那么一切都会变得美好。

精准情绪表达

了解你的喜怒哀乐

海螺语音具备情感理解能力,能够智能地识别并重现语音中细微的情感差别,有效弥合了人工智能与人类配音演员之间的差距。用户既可以让系统自动检测情绪,也可以明确指定情绪,从而生成能够精准捕捉人类深层情感的语音输出。在指定情绪中,除了中性外,有开心、难过、生气、害怕、厌恶、惊讶效果可选,自然而逼真。

为了让声音更加鲜活,情绪表达更加精准,我们 对长达超千万小时的高质量音频数据进行清洗、训练 ,最终实现高音质、情感丰富的声音效果,为用户带来前所未有的沉浸式体验。

我们指定不同情绪生成句子「关于这件事,我们可以好好谈一下」为例,感受其中的情绪差别。

试听demo:

上百种音色自由选择

效果器打造专属风格

海螺语音 预置不同语种共计300+音色 供用户选择,用户可按语言、口音、性别和年龄分类筛选。音色多变,不羁、诙谐、慈祥等风格丰富多样,有声书、ASMR耳语、新闻播报等场景均可适用。

picture.image

在选定喜欢的音色后,用户可以在效果器中对该音色效果进行精细化微调。 音色的通透性、力度可以由用户自由定义,也可以叠加回声、广播、失真、电音等特殊效果。

picture.image

试听demo:

港普(音色库-港普空姐):你好!很高兴为您提供服务,今天想喝点什么呢?

印度口音(音色库-Diligent Man):I believe that hard work and honesty are the cornerstones of success. My father always said, “Do what you love, but do it with all your heart.” And I have tried to live by those words every day.

译文:我相信,努力工作和诚实是成功的基石。我的父亲总是说:“做你喜欢的事,但要全心全意去做。” 这也成为了我日常生活的准则。

ASMR耳语(音色库-Whispering girl):Today let's relax and heal together, bringing peace to your mind and body.

译文:今天,让我们一起放松,开启身心疗愈之旅。

picture.image

T2A-01系列包含T2A-01-HD,T2A-01-Turbo两款模型供用户使用,API服务已同步上线MiniMax开放平台,企业可以根据音频质量与生成速度的需求重点来选择。在海外内测期间,凭借超一流、超预期的多语种语音生成能力,海螺语音迅速收获一众海外AI工作室、创作者好评。

picture.image

picture.image

picture.image

picture.image

picture.image

(上下滑动查看AI创作者评价)

拥有一把打开语言与声音世界大门的钥匙,MiniMax持续为全球企业语音场景赋能,走在行业前沿——MiniMax是国内首个使用大模型语音技术开放多角色配音商用接口的公司;是国内首个开设语音模型海外API服务的公司;也是国内首个与声网、腾讯和即构科技联合研发Realtime API实时交互服务方案,综合效果可对标GPT-4o的公司。

自MiniMax初代语音模型发布以来,我们结合用户需求持续迭代模型能力,为语言学习、PC语音助手、语音声聊唱聊、超拟人情感配音等十余种场景提供落地解决方案,得到了海内外上万家企业与个人开发者的肯定。随着AI技术在声音领域的进一步创新,智能化的娱乐、工作应用场景将愈发丰富多元。MiniMax邀请你一起,谱写下一段AI创新赋能的新乐章。

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论