显然他不是单纯的在模仿文字转WAV音频