然后确定下影片的基本架构文字转WAV音频