你没有指出具体是讯飞的哪个能力,但从你的描述,猜测是讯飞语音流式实时转写,需要实时发送音频流。不过我看这个能力的技术文档上,有表明采样率要求,一般pcm数据会采用16k16bit单通道:未压缩的PCM格式,每次发送音频间隔40ms,每次发送音频字节数1280B;讯飞定制speex格式,每次发送音频间隔40ms,假如16k的压缩等级为7,则每次发送61B的整数倍;标准开源speex格式,每次发送音频间隔40ms,假如16k的压缩等级为7,则每次发送60B的整数倍;
一秒的数据量 = 声道数量 位宽 采样率
假设你声道数是单声道,位宽为8bit,也就是1 X 1 X 32000(采样率32K) 字节= 25fps(40ms) X 1280
这个得看你的位宽和声道来决定