只是一次又一次地重复着这简单的镜头拍摄文字转WAV音频