可以说大半都是他出谋划策取下的文字转WAV音频