他认为这种就是尊重文字转WAV音频