但说话的时候声音也是断断续续的文字转WAV音频