毕竟他们在这方面没有什么硬性指标文字转WAV音频