但是他们自己明白文字转WAV音频