你是说我们要用模拟器之类的进行训练吗文字转WAV音频