原本的摆设或许是相对简单的文字转WAV音频