很难去定位彼此之间的关系文字转WAV音频