主要考的是法则文字转WAV音频