是根据多次演习结果做出的文字转WAV音频