甚至花了数倍吴凡的时间去训练点投文字转WAV音频