就也就是因为这种理解文字转WAV音频