开场时似乎也的确是朝这个方向发展的文字转WAV音频