这个演绎法是笔者自己看文字转WAV音频