因为他很克制文字转WAV音频