Real Voice是wordpress的一个多功能文本到语音插件。它在一个39美元的方便套餐中支持所有主要的文本到语音服务。
它配备了一个可定制的音频播放器,一个用于监控API对文本到速度服务的调用的专用仪表板,以及许多定制选项。
支持的文本到语音服务
SpeechSynthesis(网络语音API)
此选项用于在不订阅云服务的情况下使用浏览器包含的文本到语音功能。
从技术上讲,文本到速度的转换是使用Web speech API的SpeechSynthesis接口执行的。现在,语音合成已经成为任何生产网站的可行解决方案,因为所有主要浏览器现在都支持它。
SpeechSynthesis提供的自定义选项在Real Voice插件设置中可用:
语言–使用此选项,您可以选择话语的语言。
Voice–选择用户浏览器中可用的语音之一。
音高–音高值决定所生成声音的感知“高”或“低”。
速率–选择说话的速度。
Volume–这决定了音量值
亚马逊波利
AmazonPolly是一项将文本转换为语音的云服务,是亚马逊网络服务(AWS)的一部分。
它支持几乎任何语言的标准(TTS)和神经(NTTS)语音的广泛选择。
在Real Voice插件中,我们包含了所有基本选项,以充分利用Amazon Polly。具体而言,您将能够配置:
AWS区域–您喜欢使用的AWS区域。
Voice ID–从Amazon Polly提供的众多语音中选择一个。
Engine(发动机)–在Standard(标准)和Neural(神经)之间进行选择。我们建议使用神经引擎来产生尽可能自然和人性化的文本语音。
语言代码–选择Amazon Polly支持的语言代码之一。
词典名称–在这里,您可以设置要在合成过程中应用的词典名称。
输出格式–您可以在mp3或ogg_voltis之间进行选择。
采样率–提供多种采样率。
文本类型–支持纯文本或SSML。
有关更多信息,请参阅此处的Amazon Polly功能。
以下链接提供了亚马逊网络服务的服务条款:
https://aws.amazon.com/service-terms/
谷歌文本到语音AI
文本到语音人工智能是谷歌云中提供的一项服务,使用由谷歌最好的人工智能技术支持的API将文本转换为自然语音。
此服务支持大量语音和语言。谷歌根据产生声音的技术对声音进行分类。有关此方面的技术详细信息,请访问此处。
使用Real Voice设置中包含的选项,可以很容易地配置谷歌文本到语音AI生成的音频:
音频编码–此选项允许您选择音频文件的编码。
说话速率–在这里,您可以选择说话的速度。
音高–选择声音的相对高音或低音。
增益–应用于产生的音频的音量增益。
效果配置文件ID–使用此选项,您可以将特定的音频配置文件应用于生成的语音。
语言代码–在这里,您可以选择话语的语言。
语音名称–使用此字段可从该服务提供的众多语音中选择一种。
以下链接提供了谷歌云平台的服务条款:
https://cloud.google.com/terms
Azure文本到语音
文本到语音是Microsoft Azure中提供的一项服务,可将文本转换为逼真的语音。
这项功能强大的服务提供了各种各样的语音,您可以在语音库中进行测试。
让我们看看Real Voice插件中包含的Azure文本到语音选项:
区域–选择最适合您需求的Azure区域。
User Agent–一个自定义值,用于识别Real Voice插件对云服务执行的请求。
输出格式–音频文件的编码格式。此选项确定生成的音频文件的质量和占用的空间。
Microsoft Azure的法律信息:
https://azure.microsoft.com/en-us/support/legal/
ElevenLabs
ElevenLabs是一家利用人工智能和深度学习开发自然语音合成和文本到语音软件的软件公司。