最后多半是和解文字转WAV音频