如何在voice to text提高ai的精度?

测试文件在这里:
链接: https://pan.baidu.com/s/1gjZmquWCeNHs2mUH9by3sg?pwd=17ev 提取码: 17ev
任务:将voice转换成text

whisper /tmp/sample.mp3 --language Chinese --model medium

转换的文本

[00:00.000 --> 00:17.320] 白玉依山径,黄河入海流,
[00:17.320 --> 00:30.200] 玉穹千里目,更上一层楼。

有无好的开源ai,可以提供高精度的识别?

阅读 201
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进