都是在控制和压制文字转WAV音频