他们的领队是文字转WAV音频