一切完全根据时间顺序拍摄文字转WAV音频