只有达到允许范围内时才会认为是已经定位文字转WAV音频