能否提供文本转语音时同时生成srt字幕的功能

场景:
制作演示视频时,根据设计的脚本,使用文字生成音频,在线或下载后试听并调整若干次后,生成最终使用的音频,然后再制作字幕,后续再录制操作视频或整理图片,用视频剪辑软件把音频、无声视频、字幕混在一起输出最终使用的演示视频。
需求:文本转语音生成的时候,提供一个复选框生成字幕,选中后同步生成字幕,生成成功后,可分别下载音频和字幕。
现有的“字幕”功能,是根据音频来生成,存在多音字的问题,以及部分英文简称无法正确处理,使用该功能需要人工核对,如果文字多了,核对工作量会比较大。
如果现有的文字生成语音功能提供了同步生成字幕功能,则根据给定的文字来生成字幕,解决了这个人工核对的问题,并且这个功能,网站后台应该大概率可以重用现有的字幕功能,把文字改为从编辑框取,不从音频文件中反向识别。

共以下 1 个回答

  • 酷猫猫 SVIP 2026年6月24日 下午4:17

    没办法,直接生成音频,微软没有返回字幕文件,可以用批量生成,批量生成的压缩包中有一个文件类似字幕,去在线生成字幕页面操作一下就可以得到原文案的字幕,不会有错别字。

    0 赞同 0 条回复

# 回答此问题

后才能回答