似乎要把他们记住文字转WAV音频