主要还是因为传统录音设备的精细和准确文字转WAV音频