而是利用覆盖模式文字转WAV音频