接着是附近的所有人文字转WAV音频