然后就是手动模式的数据目前他还不太懂文字转WAV音频