他也沒有一个准确的定位文字转WAV音频