王 鹏  >>  正文
数据基础设施:奠定数智时代国家治理新基石
王 鹏
2024年11月26日

数据基础设施是从数据要素价值释放的角度出发,面向社会提供数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施,是集成硬件、软件、模型算法、标准规范、机制设计等在内的有机整体。

在不同的经济时代,基础设施有着不同的表现形式。农业经济时代,基础设施主要是农田水利设施;工业经济时代,公路、铁路、港口、机场、电力系统等成为新的基础设施;而在数字经济时代,网络设施、算力设施、应用设施等构建了数字基础设施。如今,数据成为关键生产要素,国家数据基础设施在国家统筹下,由区域、行业、企业等各类数据基础设施共同构成。网络设施、算力设施与国家数据基础设施紧密相关,并通过迭代升级,不断支撑数据的流通和利用。

国家数据基础设施建设的重要性

首先,国家数据基础设施建设作为数字经济时代的基石,其重要性不言而喻。在当今时代,数据已成为驱动经济社会发展的关键要素。国家数据基础设施支撑着数据从采集到存储、处理、分析再到应用的全流程,为数字经济的蓬勃发展筑牢坚实基础。

其次,正如文档《加速创新-利用现代数据基础设施为创新提供动力》中所提到的,数据通常被视为组织最宝贵的资产,一旦被组织起来并为人工智能应用做好准备,它就成为组织感知、理解和响应其环境的手段,能够为组织发现机遇、纠正方向和转向新方向提供动力。国家数据基础设施建设能够确保数据的高效管理和利用,为数字经济的发展提供源源不断的动力。

再次,完善的数据基础设施是创新的关键推动力。它能够加速技术创新和产业升级,推动人工智能、大数据、云计算等前沿技术的深度融合与应用,为经济发展注入新活力。例如,在《加速创新-利用现代数据基础设施为创新提供动力》的报告中指出,现代化的数据基础设施可以管理激增的数据,同时遵守隐私规则、应对多云环境带来的 IT 挑战、应对网络攻击的激增,还能减少能源支出。这为组织利用数据为人工智能和创新提供了动力,只有在现代化数据基础设施的支持下,创新才有可能更快地将想法变为成果。

然后,国家数据基础设施建设也是提升国家治理体系和治理能力现代化的重要支撑。通过数据共享和互联互通,政府可以更加精准地掌握社会运行状况,提高决策的科学性和效率。

最后,在《明确技术路线和实践途径!国家数据基础设施建设指引释放哪些信号》一文中提到,国家数据基础设施建设能够为政府决策提供更加精准、全面的数据支持,推动社会治理现代化。数据基础设施如同数字经济的“血管”和“神经”,能够促进数据的流通与价值释放,为构建全国一体化数据市场、培育发展新质生产力提供重要支撑。同时,在《数据基础设施保障数据安全及高效流通》中也强调了数据基础设施对保障数据安全和高效流通的重要性,这对于实现高水平的数据安全和推动国家治理现代化具有重要意义。

国家数据基础设施建设的难点分析

首先,在国家数据基础设施建设中,数据标准化、互操作性和安全性等问题成为技术研发和应用的重大挑战。当前我国数据基础设施处于起步建设阶段,数据来源广泛且格式、质量参差不齐。同时,不同系统之间的数据连接能力面临诸多挑战,以万维网为代表、面向计算模拟型第三范式的数据基础设施难以表征和有效支撑第四范式的数据价值释放模式。数据基础设施目前应具备数据互联、互通、互操作三种关键技术能力,但在实际建设中,不同系统之间建立数据连接以发现和定位数据、交换和调度数据、使用数据的能力仍面临诸多困难。例如,在AI大模型的训练和推理过程中,数据规模持续增长且类型日趋复杂,伴随着从NLP走向多模态,参数量规模从千亿级增长到万亿到十万亿级,训练数据类型也更加多样,这对数据的归集方式、组织形式和访问方式都提出了全新要求。在这个过程中,数据的标准化、互操作性显得尤为重要,否则将极大地影响数据的处理效率和模型的训练效果。

其次,传统数字基础设施在面对当今数据爆炸式增长和数据价值释放的需求时,逐渐显露出其局限性。随着数据成为关键生产要素,第四范式的数据价值释放模式对数据基础设施提出了更高的要求。然而,当前的数据基础设施在不同系统间的数据连接能力方面存在诸多挑战。例如,在数据流通利用基础设施的建设中,应用可复用性较差,只能面向单一场景和应用提供解决方案,影响了互联互通和规模化应用。此外,高速数据网虽能满足灵活、安全、高速等需求,但在数据流通利用基础设施既要让数据能流的动,还要同时保障数据所有权和数据安全,并经常要面临跨域、跨境等复杂问题时,仍需要进一步加强技术选型融合和互联互通。

再次,国家数据基础设施建设需要大量的资金投入。一方面,建设国家数据基础设施涉及到大规模的硬件设备购置,如数据中心的建设需要高性能服务器、存储设备等,这些设备价格昂贵。另一方面,软件开发也是一个重要的投入方向,需要开发数据采集、处理、分析等软件系统,以满足数据基础设施的功能需求。此外,还需要对运维人员进行培训,提高他们的技术水平和管理能力。

第四,数据产权、流通交易、隐私保护等法律法规的不完善给国家数据基础设施建设带来了法律风险。在数据流通与价值释放过程中,法律法规与合规性障碍是重要的一方面。不同部门、区域和主体在数据流通时,由于缺乏明确的法律法规,导致数据所有权与使用权界定不清晰,交易规则不明确,隐私保护难以得到有效保障。

国家数据基础设施建设的总体思路分析

《国家数据基础设施建设指引(征求意见稿)》力争在当前情况下,说清楚数据基础设施的概念、发展愿景和建设目标,指导推进数据基础设施建设。其明确了国家数据基础设施建设的主要目标,从数据流通利用、算力底座、网络支撑、安全、应用等五个方面提出要求,总体实现“汇通海量数据,惠及千行百业,慧见数字未来”的美好愿景,充分体现了宏观性和前瞻性。

首先,国家数据基础设施以行业、区域数据基础设施为主体,以企业数据基础设施为重要组成。对数据基础设施进行了系统布局,涵盖数据流通利用、算力底座、网络支撑、安全防护等多个关键领域,构建了标准化、规范化的交互接口,实现数据基础设施的互联互通,形成了完整的数据基础设施建设框架。

其次,建立覆盖政府、行业、企业等主体及国家、省、市、县等层级的全国一体化的分布式数据目录,形成全国数据“一本账”,支撑跨层级、跨地域、跨系统、跨部门、跨业务的数据有序流通和共享应用。建设数据泛在接入体系,支持数据资源、参与主体、第三方服务更大规模接入。

再次,建立高效便利可信的数据流通机制,促进数据大规模、低成本、安全自由流通。支持建设企业可信数据空间、行业可信数据空间,探索建设城市可信数据空间、个人可信数据空间、跨境可信数据空间。鼓励行业、地方积极探索建设区块链、隐私保护计算等新技术设施。支持因地制宜,探索数联网、数据元件等数据流通基础设施建设。支持建设数据流通交易公共服务平台。支持探索建设数据跨境流动基础设施。

第四,构建多元异构、高效调度、智能随需、绿色安全的高质量算力供给体系。面向 “东数西算” 等场景中对异属异构异地算力的调度需求,建立多元异构算力统筹调度的能力,实现算力和运力的高度融合,实现算力资源之间的无缝对接与协同计算,提高整体计算效率与资源利用率,实现算力最优配置与动态调整。

最后,推进算力资源科学布局,加快推动通用算力、智能算力、超级算力等多元异构算力的绿色发展、有机协同,提升数据汇聚、处理、流通、交易效率。一方面,构建泛在灵活接入、高速可靠传输、动态弹性调度的数据高速传输网络。推动传统网络设施优化升级,有序推进5G网络向5G-A升级演进,全面推进6G网络技术研发创新,为数据的快速传输提供保障。另一方面,推动网络设施升级,推进5G网络向5G-A升级演进,全面推进6G网络技术研发创新,高效弹性的传输网络可为数字金融、智慧医疗、交通物流、大模型训练和推理等核心场景数据传输流动提供高速稳定服务,显著提升数据交换性能,降低数据传输成本,为数据大规模共享流通提供高质量通道。

未来发展建设策略分析

首先,投资支持力度是关键。在数据基础设施规划安排下,研究制定国家数据基础设施建设实施方案,加大投资对国家数据基础设施建设的支持力度。

其次,强化科技创新是支撑。科研机构在技术研发方面具有专业的人才和先进的技术设备,能够为国家数据基础设施建设提供技术支持,为国家数据基础设施建设提供了新的思路、技术和解决方案。

第三,加大标准建设是保障。目前数据基础设施处于起步建设阶段,数据的多样性、复杂性和敏感性使得技术研发和应用变得尤为复杂。因此,制定统一目录标识、统一身份登记、统一接口要求的标准规范至关重要。统一数据标准规范可以夯实数据基础设施互联互通技术基础,避免不同系统之间数据连接、交换和使用的困难。通过统一标准,可以提高数据的互操作性,确保数据在不同系统之间能够顺畅流通和共享。

最后,调动全社会力量共融参与建设。更多具备能力资源的市场主体可以在数据基础设施建设中发挥作用,企业通过加大研发投入,推动关键技术的突破,发展相关产业方向,可以为国家数据基础设施建设提供有力的产业支持。

【责任编辑:严玉洁】
北京社科院研究员,北京市习近平新时代中国特色社会主义思想研究中心特约研究员,数据资产化研究院执行院长,南昌理工学院数字经济研究院院长、特聘教授。