就是划分收视基准线文字转WAV音频