而整体的拍摄进度文字转WAV音频