前面的出口很容易通过文字转WAV音频