实际上他们也只想到了三个人文字转WAV音频