他们还是能够明白文字转WAV音频