python 中如何处理音频 pcm bytes 转为 np.ndarray 或 torch.Tensor?

过程

1、前端已经获取了 pcm数据,并发送给 python server
image.png

2、在 python 中获取到了发送过来的 bytes 二进制数据
image.png

3、但是有个工具库的方法 transcribe 接收的一个音频参数 audio,期定义为 audio: Union[str, np.ndarray, torch.Tensor],这里如果先保存下来,再塞 path 给它是可以处理的。

4、但考虑到保存音频文件再读取比较耗费时间,期望直接转 bytestranscribe方法用。

想要的答案

数据不会转

  • pcm bytes 如何转 torch.Tensor 数据?
  • pcm bytes 在 python 里如何转为 np.ndarray 类型的数据?

已遇到的问题:

  • RuntimeError: "reflection_pad1d" not implemented for 'Short'

期待能够给 demo 示例,不要读音频文件的示例,谢谢。

阅读 2.7k
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题