其次是外部环境的稳定文字转WAV音频