陈新光  >>  正文
大数据环境下政府统计工作的创新研究
陈新光
01月22日

美国国家情报委员会2012年12月10日公布《2030全球趋势:可能的世界》的研究报告中指出:到2030年,有4个领域的新技术将深刻影响全球经济、社会和军事局势的发展。一是信息技术即将进入大数据时代。二是新的城市建设技术。三是新的制造与自动化技术。四是与重要资源相关的突破性技术。在这四个领域中的大数据时代,由于信息技术的发展,使得“数据储存和处理能力正在变得技术免费;网络和云计算将会全球普及;社交媒体和网络安全将会成为很大的新市场”,将对政府统计带来严峻的挑战。

一、大数据将对政府统计工作的挑战

当今世界许多有识人士也认为,大数据的出现是一场生活、工作与思维的大变革,开启了一次重大的时代转型,就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发,一场正在到来的海量数据革命将改变政府、社会与人们的生活。

(一)大数据将对政府统计权威性的挑战

政府统计是发布国情国力统计数据的主体,各级政府统计部门担负着信息、资讯和监测的职能,其主体地位是由国家的法律所赋予的。随着大数据时代的到来,政府统计部门不再是唯一的海量数据拥有者,互联网上每时每刻生成了大量的交易和价格信息。如在淘宝网上,许许多多的店主开了许许多多的网店,经营着许许多多的各种各样的商品,综合性的淘宝价格指数就应运而生。虽然淘宝价格指数中的商品种类大大少于国家的CPI(居民消费价格指数),虽然这些商品的价格对市场上全部商品的价格未必有代表性,虽然确定权重的依据也仅仅是来自这个网上购物的群体及行为,但其毕竟是在一个规模越来越大的总体基础上生成的,毕竟有实时产生的大量基础信息做基础,毕竟有越来越多的人关注、了解和参与这个不断变化着的指数。就其这一点来说,就对国家发布的CPI数据是一个挑战。

(二)大数据将对政府统计生产方式的挑战

目前海量般的数据产生的主体不一,来源更日趋多元,不同内容和形式的大数据也标准各异。是让大数据的产生者执行统一标准、或是按照统一标准进行加工,还是由政府统计把数据拿来之后再做标准化处理?不少国家已经开始运用商业记录代替政府统计,新加坡已经在利用商场和超市商业记录的价格信息计算CPI。北欧丹麦、芬兰等国均已停止传统意义上的人口普查,取而代之的是完全使用日常行政登记数据进行人口普查。

(三)大数据将对政府统计信息化建设的挑战

在大数据时代,从数据搜集到数据处理,结构化与非结构化、标准统一于标准各异、只面对样本与面对庞大的总体,差异无疑是巨大的,对后者的搜集和处理难度也明显大于前者。政府统计除了提高搜集、处理、存储过程中的技术手段外,还需要添置相应的先进设备、网络、平台等与应用大数据相适应的硬件设施。除此外,政府统计要应用大数据,需要大数据的生产者提供第三方信息,这需要政府统计要有更多懂数据、懂信息的人才,加强统计队伍建设、引进和培养复合型人才也已经迫在眉睫。

(四)大数据将对网络安全和人才短缺的挑战

由于大数据快速产生,数量不断扩大,价值不断上升,数据在使用上的信息系统和网络更加开放,使得数据外泄的风险在增加。美国斯诺登在香港向世界公开曝光的监听“棱镜门”事件,引发了全球信息安全大讨论和对人脸识别等前言技术的争议,迫使国际组织和各国政府需要调整他们的安全政策,以适应更开放和动态的环境。国际经合组织早在2002年发布的《安全指导原则》就提出在不限制数据开放的前提下,从技术层面推进安全,这对数据驱动的经济模式非常有益。

建设一支拥有数量管理和分析能力的人才队伍对实现“数据驱动经济”非常重要。这类人才往往需要具备精湛的专业技能,如信息通信、数理统计能力及具体的行业知识。随着数据分析需求的激增,在不远的将来,数据科学家很有可能短缺。美国著名咨询公司麦肯锡2011年就预测,仅美国对高级分析师的需求就将从现在的14万人增加到2018年的19万人。另外,对数据管理和普通数据分析的岗位需求也将达到150万人。除之外,大数据时代对基础设施的要求越来越高,特别是高速宽带网的要求,如移动宽带的出现极大的促进经济和商业数据的收集、传送和应用。据统计,国际经合组织成员国拥有的联网家用智能设备为18亿台,2017年将达58亿台,2022年将达140亿台。目前IPv4格式的网络地址基本被用完,未来的上百亿台设备亟需政府启动向IPv6的迁移。但是目前网络地址的转移非常缓慢。

二、政府统计应对大数据的创新与应用

在大数据时代,随着信息技术的发展、民主意识的崛起、政府执政理念的转变,政府也在逐渐转变自己的角色,现已成为世界各国政府的共同理念。美国现任总统奥巴马曾指出:“为了引领一个开放政府的新时代,面对信息,政府机关的第一反应必须是公开。这意味着我们必须坚定地公开信息,而不是等待公众查询。所有的政府机关都应该利用最新的技术推进信息公开,这种公开应该是及时的。”大数据的重要意义和深远影响如同《大数据时代》作者维克多所说,大数据时代的经济学、政治学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。

(一)充分运用大数据,官方统计数据收集多元化

“大数据”突出的特点之一就是数据产生频率高。在统计数据的搜集上:一是官方统计要充分利用和使用行政记录或商业记录,作为统计调查数据的重要来源,继续得到满足统计需要的数据资料,就能够有效降低调查成本。本文已经提到了新加坡、芬兰、丹麦等国运用商业记录取代政府统计就是典型范例。二是合理利用大数据资源提高攻击数据的及时性,缩短统计数据生产周期。比如,在网络销售领域,互联网实际上已经成为获取价格信息的丰富来源,中国阿里巴巴淘宝网发布综合性淘宝价格指数就是其中一例,使用这类信息能够缩短政府统计数据生产的周期,弥补政府统计调查在及时性方面的不足。三是合理利用大数据资源可以改善官方统计数据的质量。官方统计的很多数据是通过抽样调查取得的,由于经费等制约,数据的精确度和覆盖范围有限,有时还要面对“瞒报、拒报和漏报”等情况。大数据在某些领域却能够提供覆盖全部(或近乎全部)对象的数据资料。

(二)加强大数据研究,实现统计管理模式创新

可以说对大数据的研究将是世界各国未来科技及经济社会发展的重大研究战略之一,因为只有紧紧抓住大数据时代这个大机遇,才能得到大数据的大价值:一是要优先网络大数据的研究。这是大数据的重要组成部分,与人、与社会科学的活动密切相关。同时网络数据科学和工程是信息科学技术与社会科学等多个不同领域高度交叉的新型学科方向,对国家的稳定与发展有独特的作用。

美国奥巴马政府已投资2亿美元支持大数据的发展,同时支持建立全球性的互联网域名系统,早在2009年就由美国商务部负责开发,以增加互联网领域的透明度,而不让某个国家或地区控制互联网。二是要加强大数据科学的基础研究,包括大数据分析算法和大数据系统的效率研究。其基础研究离不开对相关学科的领域知识与研究方法论的借鉴,包括大数据基础研究和大数据环境下的计算模型及大数据的安全问题等。三是要加强大数据研究的组织构架研究。中国政府已经启动了“中国大数据科学与工程研究三年行动计划”,并从宏观上对我国的大数据产学研用做出系统全面的短期与长期规划,酝酿成立国家级的行业大数据共享联盟。

(三)以创新为本,将大数据开发作为新的经济增长点

大数据的出现被人认为就像是世界第三次浪潮的到来一样,孕育着大数据时代的到来,一个大规模生产、分享和应用数据的时代正在全球开启。许多企业和研究咨询机构已发现了这座金矿所蕴藏的巨大价值,利用所谓“数据挖掘技术(DataMining)”国际经合组织前不久公布了一份题为《探索数据驱动创新作为一种新的增长源泉》的报告。报告提出,社会和经济活动的不断网络化,数据收集、传输、存储和分析成本的下降,共同导致了一个有助于培育新的产业、工业和产品的大数据时代的出现。报告提出,由数据驱动的社会经济模式开始显现,数据已成为创造竞争优势和驱动创新、可持续发展的核心资产。大数据给我们带了的真正机遇是把许多信息碎片拼起来,为我们的决策服务。

大数据时代最大的挑战是如何从大数据中获取最大价值,需要创新和探索。在大数据时代,数据科学家既要熟悉商业环境,也要有操作层面的知识,通过生成、采集、存储、加工、发布、分析等六个环节形成数据价值链。由于数据链的成本降低,推动着数据生成与使用的增速,同时随着网络参与度的提高和电子服务的推广,由此产生的现象——通常被称为“大数据”——标志着向数据驱动型经济的转移,在这样一种经济中,数据增强竞争力,推动创新、公平与可持续发展。据美国麦肯锡的一份报告中提到,大数据的增值形成了亿万美元的推动力,在公共管理、在线广告、医疗卫生、公用事业和物流运输五大行业,通过数据使用显示了创新和生产力增长的高潜力。

(四)审视“海量数据”,呼吁各国加强统计立法工作

国际官方统计界早在上世纪末就开始使用或关注大数据的发展,早在1992年“利用行政记录”就被写进国际官方统计基本原则。联合国《官方统计基本原则》第五款规定:用于统计目的的数据可以来自各种渠道,如统计调查或行政记录等。目前,美国、欧盟是最早使用行政记录的国家,目前有些国家还利用商业纪录作为官方统计的一部分,其中丹麦和芬兰并用商业记录取代国家的人口普查。中国新修订的《中华人民共和国统计法》第二章第十六条明确规定,统计调查要“充分利用行政记录等资料”,这是中国使用大数据在法律的依据。

中国人大通过的加强网络信息保护的决定就是一个好的开始,当前正在加紧制定《中华人民共和国信息公开法》,提出信息公开为原则,以适应大数据时代的到来,防止信息被损坏、篡改、泄露或被窃,保护公民的隐私和国家的信息安全。提高官方统计服务水平,打造法治政府、透明政府。大数据时代统计数据的开放,要求是更深层次的,包括获得数据的方式、产生的方法必须是透明的,必须同时发布一系列的文档说明数据的来源和产生的方法,向社会公布各项数据的详细指标解释。政府职能要转向公共服务,减少对市场的干预,充分发挥社会主义市场经济的作用,创新公众参与渠道,以提高政府治理的效率。

中国社会科学院-上海市人民政府上海研究院研究员、上海市统计学会副会长、全球化智库(CCG)特邀研究员。
互联网举报中心 防范网络诈骗 法律顾问:炜衡律师 视听节目许可证0108263京公网安备110105000081号京网文[2011]0283-097号
中文 | English