并且找到了我们的确切位置文字转WAV音频