必须全程监视着文字转WAV音频