从三个人的分工来看文字转WAV音频