可以观察到目标所处的位置文字转WAV音频