他们实验之前就没进行模拟推演么文字转WAV音频