说白了就是一段提前录制的声音或者影像文字转WAV音频