所有的步骤都在他脑海当中一一展现文字转WAV音频