已经不需要通过特定的衣服和腰带去辨别文字转WAV音频