当时我们确实疏忽了文字转WAV音频