我提议我们可以分成多组行动文字转WAV音频