我建议你主要使用六人和十二人的规模进行编组文字转WAV音频