只是他追求的是一种难度文字转WAV音频