他们代表着最终决定文字转WAV音频