但是却不能准确地分辨出准确的身份文字转WAV音频