所以都是很分散的文字转WAV音频