可现在他看到的和自己打听到的是完全不一样的文字转WAV音频