至少告诉我们如何区分能量体和本体文字转WAV音频