但他却可以根据方源的动作文字转WAV音频