所以他无法准确的找到所有杂质的未知文字转WAV音频