然后进行一个简单的框架性推荐文字转WAV音频