而在人群最中间的文字转WAV音频