虽然他尽量节省着使用文字转WAV音频