他指的应该是自己的样貌文字转WAV音频