他确实不会解释文字转WAV音频