既然已经知道他们的准确位置文字转WAV音频