也许你可以和西蒙提前练习几个重点场景文字转WAV音频