单只是最后一道检查文字转WAV音频