我觉得建新建的方案可以考虑文字转WAV音频