他们会选择给予一定的排片比文字转WAV音频