ElevenLabs主要提供文本生成8种语言的语音、语音克隆、语音合成、语音识别分类,基本上与Meta在前几天发布Voicebox的功能几乎一样。但Meta仅公布了论文并没有发布任何代码和产品,而ElevenLabs早就开始商业化落地。

ElevenLabs不支持中文语音,但是能识别中文。当把一段中文版《八百标兵奔北坡》绕口令生成语音时,神奇的一幕发生了,老外读出来的语音居然和综艺节目上的一样喜剧效果拉满,并且几乎接近真人发声。

资料显示,ElevenLabs创立于2022年4月,总部位于美国纽约,仅有10多名员工,曾在2023年1月获得200万美元种子轮融资。
ElevenLabs于今年1月正式推出了测试产品,目前注册用户超过100万受到了全球多家知名企业的青睐,例如,世界上最大的有声读物出版商之一的Storytel;
全球内容创作者平台TheSoul Publishing;知名游戏开发商Paradox Interactive等。这些客户通过ElevenLabs平台制作有声读物、电影配音、游戏NPC的声音等。
产品方面,ElevenLabs基于目前强大的生成式语音模型,提供文本生成语音、语音合成、语音克隆和语音识别分类功能。
文本生成语音:用户通过文本可直接生成英语、德语、波兰语、西班牙语、意大利语、法语、葡萄牙语和印地语8种语音,同时支持跨文本语音生成。例如,上传了一段英语文本,可直接生成意大利语音。
语音克隆:用户提供一段自己或他人的语音片段,将其上传到ElevenLabs平台。然后点击文本生成语音,可以选择最新上传的语音克隆声音。
为了减少ElevenLabs平台生成一些非法语音,例如,模仿他人亲戚用于电信诈骗,ElevenLabs推出了语音识别分类功能,用户只需要上传语音便能快速识别出是真人发音或AI自动生成的,这对于提升ElevenLabs的安全性非常重要。
ElevenLabs首席执行官兼联合创始人Mati Staniszewski表示,在过去5个月的时间,我们的产品被全球超过100万人使用,这充分说明人们对生成式AI的喜爱。我们会持续优化、迭代功能,为用户提供安全、稳定的AI服务。

发表回复

后才能评论