如此复杂的变化如何能够记住文字转WAV音频