首先读出了上面的中文文字转WAV音频