并能作出正确判断文字转WAV音频