主页 > 服务项目 > 工程咨询 > 工程咨询

我们自身对数据本质理解比较深刻

  ”为主题,以数字政府、智慧城市、互联网+政务服务、数据治理、信息社会等为主要议题。会议由中国社会科学院信息化研究中心、北京国脉互联信息顾问有限公司联合主办,国脉海洋信息发展有限公司、浙江蟠桃会信息技术有限公司协办,共有来自全国部委/省/市/区县电子政务、智慧城市、大数据主管领导、行业专家、企业代表、主流媒体千余人参会。

  在23号下午的“2017政务信息系统整合共享与数据资产普查研讨会”上,国脉海洋常务副总经理、高级咨询师王路燕以《大数据时代政府数据资产管理实践》为主题进行了分享。

  今天主要结合我们做过的浙江省、海南省以及其他地方的实际案例,分享国脉在大数据时代政府数据资产管理方面的探索和实践。

  首先看一下大数据时代讨论的热点,大数据概念提出几年来,现在关于大数据的讨论主要有三个角度:

  第一个是大数据技术,现在做大数据,就要有平台、传统的数据仓库以及实时的计算,这些都要涉及到方方面面的大数据技术。政府要做新的技术,要做大数据架构,我们有时候会问他们:到底有哪些数据?这些数据的哪些部分适合哪些技术?很多地方企业都没有想明白这个问题。

  第二个是应用场景,这个图是银行给的场景,现在有这么多数据,这些数据到底要用在什么业务上?它的应用场景是什么?很多政府部门以业务需求为导向做大数据,不切合实际。

  第三个是数据交易,这是最近的热词,以前公司都讲有金融资产、人力资产、物质资产,但是现在企业都在想做数据资产,包括国内外的一些专家、研究机构都在探讨自身的数据资产如何进行估值,数据资产如何能够进入到企业的资产负债表中,最后能够变成实际的价值。同时我们梳理了一下,目前全国很多地方都成立了数据交易中心,贵阳有两个,分别是贵阳大数据交易所、贵阳现代农业大数据交易中心。数据在交易过程中,它是不是真的适合被交易?数据的一些特性方面是不是符合交易? 在数据质量和数据量方面,哪些数据资产被盘点清楚了?这些问题都没有考虑。

  通过对大数据时代热点的讨论,我们可以通过这些问题来进行导向,政府部门到底有哪些数据和系统?产生了哪些业务?这些数据系统之间的关系是什么样的? 这些都是不清楚的。最后问题总结起来就是数据资产不清晰、数据价值难以体现、数据质量不高,主要因为没有从底层开始做这些系统、业务。

  这个图是国外的研究机构做的数据管理成熟度分析,左边是2016年的内容,右边是今年的。这里有一个非常有趣的现象,可以看到红色的那些点,代表还没有到达成熟期之前,这个词已经过时了。通过图可以看到,2016年有三个词过时了,一个是大数据,一个是大数据技术,从侧面说明大数据发展了这么多年,现在这个词已经过时了,大数据已经是常态,刚出来的时候觉得很难处理,现在我们都顺应了这个趋势。

  2017年有两个红点,一个是数据目录,第二个也是大数据相关的,这两个词以后还会过时,这些词的成熟度反映了我们关心的大数据的未来发展趋势和方向,现在重点的关注度在哪?我们如何解决这些问题?

  其实我们也做了一些相关的研究,这是数据知识管理体系,提到数据管理分为十个层面,从数据架构管理、数据开发、数据操作到元数据管理、数据质量管理、数据安全管理再到主数据管理、数据仓库管理、文档和内容管理,最后到数据治理。这十个层面之间的关系是什么样的?我认为基础的核心工作是数据架构管理、数据开发、数据操作,任何一个数据从无到有,都要经过这三个步骤,首先要做数据架构的设计,然后做数据开发,再去做数据操作;得到这些数据后,还不能用,我们要去关注数据的三个特性,包括元数据、数据安全、数据质量;然后提出专项的数据方案,包括主数据管理、数据仓库管理以及文档和内容管理,这三个专项的方案对应的是要做下面所有的数据特性和核心工作,从数据治理角度来讲,这些都是要做的。

  数据治理和数据管理这两个概念一直在混淆,数据治理是具有方向性的,比如工作组织、体制机制、人员分配等,而数据管理管理主要做一些具体的工作。

  这些我们可以从两个角度去判断,第一个是从空间的视角,第二个是从时间的视角。从空间的视角看,我做了一个类比,上面一张图是关于中国历史的,为什么中国是一个集权的国家?其实这跟中国历史有关,也跟中国的地理有关,因为中国以前有水患,黄河发水是四处流的,不管国家的边界、区域、省份,水患发起来就四处流,要有一个相对集权的体制去治理水患。

  类比到数据,从空间的视角来看,从不同的业务系统产生,经过加工处理之后,再到不同的业务部门;从时间的视角,数据的生命周期从数据的规划到标准再到开发实施和维护,以前我们没有关注数据的生命周期,关注的是系统下面的数据周期。我们要做系统的规划、分析、设计、开发到最后的部署上线,整个过程有了系统之后,基于这个系统做数据的管理创建。在系统之后,我们再去考虑数据质量的问题,考虑数据质量要求是不是符合提出的目标,其实已经晚了,整个数据生命周期在规划分析的时候就要考虑进去,这是围绕数据生命周期来讲的。

  第一个是数据资产体系,如何把数据资产理清楚?资产不是独立的,要理清楚关系。

  第二个是数据的标准体系,如何进行制定编码的标准、分类的标准、分层的标准?

  第四是数据服务体系,基于这些模型,如何做整个数据服务?包括交换共享、数据应用。

  我们对应做了数据基因架构体系,包括理论上、概念上的数据需求,从数据元和政府数据清单梳理开始,通过一些技术手段做数据的采集,最后形成数据治理来提升整个数据的服务。

  关于数据基因的服务体系,我们围绕整个数据体系提出了十个体系和九大服务,所有的产品都是技术加服务结合在一起做相关的工作。下面我讲一下应用案例,如何把十大系统和九大服务体现在案例上面。

  我们做贵州资产登记的时候思考了很多,政府数据资产是什么?如何定义它?我们做了很多权属关系,数据资源的登记项包括这些清单的要素是什么?做了很多的梳理工作,梳理完之后,我们做了一张资产地图,以下是具体应用的实际落地案例。

  做广州市的数据资产管理系统时,我们梳理一级委办局,信息系统近500个,系统资源近3000项,数据字段近25万项,我们会选取一些出现频率高的,对它做一些追溯的分析,做一些标准化和实际质量的报告。

  我们给浙江省做了全省的信息系统普查,普查了近1000多个系统。对这些系统普查之后,做了一个诊断,系统填报上来的清单有个自动诊断的功能,根据相应的条件进行设置,比如说孤岛系统,我们要定义什么是孤岛系统,按照量化去设计;比如业务专网,跟其他网络不能通的,肯定是孤岛,这个系统中跟其他系统没有关联的是一个孤岛系统。我们扫描识别没有上云的、访问程度低的、日均少于1000的系统,这些条件设置好以后,系统自动会出一个诊断报告,告诉你这个系统要达到什么标签,这是在浙江省做的政务信息系统。

  数据目录梳理,我们做了很多地方的案例。首先从应用系统出发,我们现在的系统以应用为导向,就是引用系统里面有哪些数据,这些数据采用的结构是什么,这个表结构可以通过采集的方式,只要部门提供系统的用户名和访问的网址和密码,就可以把表结构提取过来,可以形成相应的数据资源目录。

  这个目录不是说表结构里面是怎么样就怎么样,要进行分层分级分类。对数据进行分层分级分类以后,就形成了一个数据目录,基于这个数据目录上,我们提出了一个概念叫做目录梳理的流程,即未来相应的所有部门,要去创建它的表或者修改它的表,它的路口一定要在这个目录系统的路口去生成相应的数据库表,把数据库表结构导入前置系统中,然后部门再推送相应的数据。

  我们也在海南省做这一块相应的工作,包括跟国家层面的系统对接,淮安我们做了80个部门的对接。

  后面一个案例是大家比较关心的,我们做到业务层面的浙江省的数据供需对接,浙江省提出了几个概念,第一个是数据项,数据项是证照、表格、结构化类的数据,然后由这些数据项组成了相应的数据,数据是针对这些事项所需要的材料,比如证照、批文,这些统称所需要的数据。事项数据串是说事项要实现跑一次,它涉及的数据集有些是可以自行填写的,有可能是部门内部共享的,有可能是形成一个我的事项数据串。到我的事项,我对这个事项的解析非常清楚,我的这些事项要实现跑一次,这些材料涉及到哪些数据项,数据项是如何打通的?

  相对应的数据共享的业务应用系统分为两种部门,一个是需求部门,一个是数源部门。需求部门可以对事项数据串提需求,然后由数源部门进行相关数源的确认,然后我们现在梳理了省级单位前100项,形成一个后续对接的情况。

  具体在做的过程中,我们还做了一项工作是数据标准化的工作。我们发现部门的需求是各种各样的,比如说一个证照由营业执照、营业执照副本、营业执照正本、营业执照复印件、工商营业执照、港商企业法人营业执照,其实这代表的都是一个营业执照,那么怎么样进行规范化?我们做了一个技术数据字段标准,就是数源部门确认后就会加到这个标准里面。下一次需求部门提出来的时候,在这个标准词里面会自动匹配过去。需求部门去提相应的需求,提了一个需求以后,这个需求就会对应发送给这个数源部门,数源部门登录这个系统,他就会来进行确认,这个数据字段提出的需求,是不是数源?如果是,它要确认,要确认这个数据是哪个材料?哪个业务系统?哪个事项产生的?它的来源是什么?然后我们根据数源部门提供的内容形成数据责任表。当然也可以说不是数源,我们把这类数据进行系统派发,部门来进行命名,到底哪个部门才是权威的数源部门,这是最多跑一次的支撑,一体化政务服务平台梳理好之后,通过共享平台真正能够实现一次办理。有些字段可以通过共享,不需要再重复填写,材料不需要重复提交。

  很多地方说,真正实现只要去一次或者两次,前提是这些材料的代替,最难的是如何做好这些材料的收集。浙江省做的工作是不要重复提交材料的,就是通过减材料这些环节。

  这是非常完善的一个体系,前面是一个需求体系,后面是完善的共享体系,如何通过部门的需求清单,相应的需求提出来以后,把责任清单的数据归集到数据资源中心,最后通过共享接口获得想要的数据。

  政府从2007年就在做数据共享这件事情,为什么做了十几年,到现在为止还是在做?我们分析了一下,有几个问题:

  第一个是数据的形式,之前许多的资源目录和交换平台、共享平台,有许多数据在上面,梳理出来的数据哪些部门真的看得懂、用得上,这些数据到底是不是真正发挥了价值?我经常看到部门报数据说,报送量是多少,在这其中它到底发挥了哪些价值?

  第二个是管理模式,如何实现可持续的数据共享体系?我们在做浙江省项目时提出了一个概念叫做数据的共享,要有一个共享需求,这个需求一定要与部门相关,能够立即用的,一定要有一个完善的共享体系,整个共享平台一定是非常健全的,最后形成整个数据之间的流动,归集起来就是能够使数据真正活下来、用起来。

  我们是理念+实际操作相结合的公司,我们自身对数据本质理解比较深刻,为政府做了这么多年咨询工作,拥有了大量的经验总结,对政府业务的逻辑很熟悉,现在也有了很多落地实施案例。今天的分享主要到这里,谢谢大家。

秒速飞艇平台公司简介组织机构企业资质企业荣誉主要业绩
服务项目项目管理工程咨询造价咨询招标代理
成功案例招标代理造价咨询项目管理税务咨询
新闻中心新闻动态行业新闻
企业文化企业文化员工活动

Copyright © 2013 秒速飞艇平台有限责任公司 版权所有
地 址:广州番禺珠江路林华大厦9号 邮 编: 581900 电 话:(020)22669874 22669851 传 真:(020)22669851   粤ICP备36652871号 网站地图 网站导航