的确会忽略过去文字转WAV音频