这样就能按照远近亲疏的不同分别使用了文字转WAV音频