最重要的是要懂得处理这中间的平衡文字转WAV音频