那是一种极其复杂的表情文字转WAV音频