他们也应该熟悉自己的声音文字转WAV音频