AI声音克隆,亲耳听到的声音未必是真的

现在大家有没有发现,经常接到一些促销骚扰电话,大家可能以为是真人打的,因为声音是真人的声音,而且他还能根据你的不同反馈做出不同的回答,其实这是一个机器人在跟你聊天,她采集了客服人员的声音,内置了语音识别模块,根据我们的语音反馈做出不同的回答,现在已经用在客服系统、快递下单、促销电话、电话提醒等方面,那么今天我们要讨论的就是AI人工智能如何复制别人的声音。

文本到语音(TTS)合成是指文本到音频的人工转换。人类通过阅读来完成这项任务。一个好的TTS系统的目标是让计算机自动完成。

AI声音克隆,亲耳听到的声音未必是真的
在创建这样一个系统时,一个非常有趣的选择是为生成的音频选择哪个声音。应该是男人还是女人?声音是大还是小?
在进行深度学习的TTS时,这是一个限制。您必须收集文本-语音对的数据集。录制这个语音的演讲者是固定的——你不可能有无数的演讲者!
所以,如果你想为自己或他人的声音创建音频,唯一的方法就是收集一个全新的数据集。
这时我们熟悉的谷歌(Google)又出现了,来自谷歌的研究绰号“语音克隆”(Voice Cloning)人工智能,它使计算机可以用任何声音大声读出信息。
语音克隆的工作原理
很明显,为了让计算机能够大声读出任何声音,它需要以某种方式理解...

点击查看剩余70%

{{collectdata}}

网友评论0