她是认出他们是文字转WAV音频