他至少得配合现场的音效文字转WAV音频