首先我们用浏览器打开网站 在线文字转语音_酷猫猫的软件小屋 (text-to-speech.cn) ,推荐使用Edge浏览器。

如果未登录需要微信扫码登录,此功能需要开通本站会员(会员只有时间长短区分,没有生成下载限制,每日都有50万字额度)才可使用,想试用可访问主站Text To Speech – 在线文本转语音 (text-to-speech.cn),每天2000字免费额度。

文字转语音使用教程插图

一切准备就绪后,在左侧的文本框内写入我们需要生成音频的文本,可以用一件清理删除当前文本框中的内容,写入文本后选择右侧要使用的语言语音等选项,质量越高生成的音频比特率越高,但是生成速度会慢,生成成功或者失败会有提示音效。

按钮介绍:

试听 播放第一句文本,用来测试右侧设置的参数是否符合要求。

生成 将文本框内所有文字根据右侧设置参数生成语音。

SSML生成 参考此文章:微软文字转语音SSML教程和示例_酷猫猫的软件小屋 (text-to-speech.cn)

多音字 会在文本框内输入设置多音字的代码,例:<phoneme alphabet=”sapi” ph=”hai 2″>还</phoneme>有。
<phoneme alphabet=”sapi” ph=”huan 2″>还</phoneme>给你。 只需要修改 ph=”hai 2″ 引号内的部分即可设置多音字,1234对应声调1234声,5是轻声。

停顿 会在文本框内输入设置停顿的代码,例</phoneme><break time=”5000ms” /> 将此代码放在文本任意位置,可以停顿5秒,参数可以自定义修改。

模型 右侧设置好语音参数后,点击模型,输入模型名称,可以将右侧参数保存到模型里,再次点击模型时会有之前设置过的模型名称,点击模型名称可将对应参数一键使用。

ps:模型还可以对应多语言切换功能使用,设置多个模型后点击多语言切换可以每句话用不同模型,这样就实现了类似对话的生成模式。

查看 部分浏览器不支持直接下载,可点击查看,在查看的页面找下载按钮。

下载 生成后下载音频文件。

注意:

如果生成失败,可能是文本中有特殊字符无法识别,也可能是质量选择的太高并且字数太多导致生成时间太长,服务器响应超时,降低质量或者减少字数生成即可。

失败时先检查以上情况,并且只生成一句话试一下,如果一句话能生成,那么99%属于以上两种情况。

如果确认没问题,还是无法生成的,可联系站长咨询。

发表回复

后才能评论

评论(4)