不管是什么样子的结果都是可以接受的文字转WAV音频