测试文件在这里:
链接: https://pan.baidu.com/s/1gjZmquWCeNHs2mUH9by3sg?pwd=17ev 提取码: 17ev
任务:将voice转换成text
whisper /tmp/sample.mp3 --language Chinese --model medium
转换的文本
[00:00.000 --> 00:17.320] 白玉依山径,黄河入海流,
[00:17.320 --> 00:30.200] 玉穹千里目,更上一层楼。
有无好的开源ai,可以提供高精度的识别?