所以不会在彼此针对文字转WAV音频