刚刚他们的做法确实是不太讲究文字转WAV音频