就是留着储备文字转WAV音频