一系列的动作便是完成文字转WAV音频