而是要解释这些新词汇的源头文字转WAV音频