所以他们看的不太清楚文字转WAV音频