内容简介
《可信数据空间建设理论与方法》从数据空间的基本概念入手,分析和探讨了数据空间的定义、类型、特征、功能、架构、组件和关键技术,以及数据空间与数据要素市场的关系等基础理论问题;同时,结合具体实例,从多学科视角对数据空间内数据安全与信任体系构建、数据连接器与参与者认证、数据集成与互操作方法、信息模型与词汇表设计、数据生态体系建设等重要问题进行了深入且系统的论述。
精彩书摘
第1部分可信数据空间概论
数据是数字化、网络化、智能化发展过程中形成的重要资源,是新型生产要素。数据要素流通是培育数据要素市场的基本前提,是推动数字经济发展的必然要求和核心引擎,是促进数字政府持续长效运营、激活政府公共数据的社会化价值和市场化潜力的重要手段。与此同时,数据如何高效、安全地共享和流通,成为制约数字经济发展的关键因素 。数据空间的建设目标是,以数据高效流通与共享利用为导向,以实现数据的供需匹配为目标,推动数据价值链上下游多元主体和多源数据的汇聚融合,从而实现价值共创。因而,数据空间作为一种创新的数据(主权)管理、流通与共享机制,正逐步成为解决这一问题的有效方案。
数据空间是一个新兴概念,是一个总括术语,指涵盖数据模型、数据集、本体、数据共享合同和专业管理服务等的数据生态系统,以及与之相关的软能力(即治理、社会互动、业务流程)。数据空间既是多组协议,也是数据共享的辅助技术基础设施。截至2024年5月15日,Data Space Radar公布了160个数据空间项目案例,其中,2023~2024年增幅*大,新增近40个。从数据空间的分布领域看,制造业/工业4.0领域的数据空间案例*多,占比19%;能源领域次之,占比14%;移动领域占比10%,智慧城市领域占比为9% 。从整体上看,各领域的数据空间的建设目标具有较高的一致性,通过提升数据空间内数据的互操作性和可获取性,促进数据流动、交易和共享,激活产业的数据驱动型创新。那么,什么是可信数据空间?为什么我国发展数字经济,发展数据要素市场,提出要建设可信数据空间?可信数据空间有什么特征,与数据云、数据中心、数据开放平台等有何区别和联系?数据空间具有什么架构、功能,以及由哪些组件构成?等等,都是人们关注的问题。
本部分通过对数据空间的内涵、特征、体系架构、关键技术和核心组件的论述,让人们对数据空间有整体的认识。
第1章可信数据空间概述
数据和信息共享,一直以来都是人类的愿望。特别是20世纪80年代,互联网诞生之后,这种愿望更加强烈。美国马克卢普(F.Machlup)教授,在1962年出版的信息经济的**论著《美国的知识生产与分配》中提出“知识产业”和“信息经济”的概念,并指出信息产业在美国国民经济中的重要地位。后来,随着信息技术的发展和互联网的普及,信息经济逐渐成为一个被广泛研究和讨论的话题。
2005年,美国计算机科学与技术领域的专家迈克尔 富兰克林(M.Franklin)等从现实需求(如何实现跨域异构数据的集成与共享)的角度出发,提出数据空间(DataSpace)的概念[1],指出组织(如政府机构、企业、家庭)的正常运转依赖海量跨域、异构又互相关联的数据源,从而将数据空间定义为一种涵盖特定组织全部相关信息的数据共存方法,采用数据集成、数据虚拟化、语义建模和元数据管理等技术统一组织管理数据,提供数据编目和浏览、搜索和查询、更新和监控、事件检测和支持复杂工作流等服务。
1.1数据空间的内涵
随着数据空间相关理论研究和实践的不断发展,数据空间的内涵也发生了很大变化。已经从早期的对异构数字资源的融合共存技术,延伸为数智融合环境下,新型数据关系、数据权益保障、数据信任机制与合规治理等数据流通和交易制度体系的建构,以及数据安全技术框架、基础设施搭建等系统性问题的探索。
1.1.1数据空间定义
数据空间概念的提出,缘起于对异构数据库的整合。由于传统数据库技术无法满足跨域、异构、海量、不确定性数据管理的需要,美国计算机科学与技术领域的专家迈克尔 富兰克林等,于2005年比较系统地提出了数据空间的概念。所以,目前业界通常认为,数据空间概念*早于2005年由美国计算机科学与技术领域的专家迈克尔 富兰克林等提出。也有部分研究认为,数据空间概念,*早由德国弗劳恩霍夫协会(Fraunhofer-Gesellschaft)于2014年提出,旨在解决工业领域数据安全共享与互操作性问题[2]。德国Gaia-X协会认为,数据空间是基于公共政策、规则和标准的,联邦、开放的主权数据共享基础设施,并将数据空间定义为“受信任伙伴之间的数据关系类型,每个伙伴都对数据的存储和共享应用相同的高标准和规则”。在数据空间中,数据不是集中存储的,而是在源代码上存储的,只在必要时进行共享(通过语义互操作)。2020年,欧盟委员会发布《欧洲数据战略》指出,欧洲数据共享空间是指由跨越部门、组织和地理界限的众多不同空间组成或连接在一起的空间。数据空间也可被视为数据生态系统的总称,其发展受益于数据安全与共享技术、合适的监管框架和创新的业务模式。
数据空间作为一个新兴概念,提出时间不久,且*近几年才受到广泛关注。因此,客观上说,目前数据空间的相关研究和建设还很少。有关项目也多停留于概念规划、设计和探讨阶段。不过,关于多元异构数据集成、整合、共享等问题已有很多研究。
关于数据空间
目录
目录
前言
第Ⅰ部分 可信数据空间概论
第1章 可信数据空间概述 3
1.1 数据空间的内涵 3
1.1.1 数据空间定义 3
1.1.2 可信数据空间 6
1.1.3 可信数据空间建设的意义与价值 9
1.2 数据空间的功能 10
1.3 数据空间的类型与特征 11
1.3.1 数据空间的类型 11
1.3.2 数据空间的特征 13
1.4 数据空间与数据中心等的异同 16
1.5 数据空间建设现状 18
1.5.1 国际数据空间的发展 19
1.5.2 我国可信数据空间的实践探索与理论研究 21
1.6 本章小结 23
参考文献 24
第2章 可信数据空间的架构 27
2.1 数据空间建设目标与原则 27
2.1.1 数据空间建设目标 27
2.1.2 数据空间设计原则 29
2.2 国际数据空间参考架构 31
2.2.1 IDS-RAM 的五个层次 32
2.2.2 数据空间参考架构模型的三个维度(或视角) 35
2.2.3 数据空间的四类主体 36
2.3 我国可信数据空间架构设计 37
2.3.1 我国可信数据空间建设背景 37
2.3.2 可信数据空间设计原则 38
2.3.3 可信数据空间功能需求分析 38
2.3.4 数据空间功能架构 40
2.4 欧盟工业数据空间(Gaia-X)架构 45
2.5 我国数据空间架构实践 46
2.5.1 可信工业数据空间建设 46
2.5.2 城市数据空间体系架构 49
2.6 本章小结 50
参考文献 50
第3章 数据空间关键技术和组件 51
3.1 创建数据空间 51
3.1.1 创建数据应该思考的问题 51
3.1.2 数据空间的功能 53
3.2 数据空间关键技术 55
3.2.1 信任体系 56
3.2.2 数据互操作 58
3.2.3 数据访问控制 63
3.2.4 数据使用控制 65
3.2.5 分布式架构 69
3.3 数据空间构件 71
3.4 数据空间核心组件 72
3.4.1 数据连接器 73
3.4.2 应用程序 73
3.4.3 应用商店 74
3.4.4 元数据代理 74
3.4.5 清算中心 76
3.4.6 词汇中心 77
3.5 本章小结 78
参考文献 78
第Ⅱ部分 数据空间信任体系构建
第4章 可信数据空间信任体系建设 81
4.1 数据空间信任体系概述 81
4.1.1 信任的内涵与信任体系的维度 81
4.1.2 数据空间建立信任的必要条件 83
4.1.3 数据空间信任体系的核心要素与主要功能 83
4.2 数据安全的法规与政策(政策层) 84
4.2.1 数据安全可信与数据合规 84
4.2.2 欧盟的相关数据安全政策 85
4.2.3 我国的相关数据安全政策和标准规范 86
4.3 数据访问和使用控制(管理层) 88
4.3.1 数据权属的相关概念 88
4.3.2 访问控制策略和使用控制策略 89
4.4 数据可信安全技术(技术层) 94
4.4.1 数据溯源 94
4.4.2 数据审计 98
4.4.3 区块链 99
4.4.4 智能合约 104
4.4.5 密态计算 109
4.4.6 数据沙箱 111
4.5 本章小结 112
参考文献 113
第5章 可信数字身份与参与者信任网络构建 114
5.1 可信数字身份 114
5.1.1 数字身份概述 115
5.1.2 数字身份的功能 116
5.1.3 基于区块链的数字身份构建 117
5.1.4 数字身份认证的发展趋势 120
5.1.5 数字身份安全体系构建 121
5.2 参与者信任网络 122
5.2.1 参与者信任网络构建目标 122
5.2.2 参与者信任网络构建 123
5.2.3 参与者动态信任网络 126
5.3 数据空间的信任机制 128
5.4 本章小结 130
参考文献 131
第6章 数据空间认证机制与认证框架 132
6.1 认证机制概述 132
6.1.1 认证 132
6.1.2 认证机制 134
6.2 数据空间认证框架 135
6.2.1 数据空间认证框架内涵与核心要素 136
6.2.2 IDS-RAM 不同层面解决的认证问题 137
6.2.3 数据空间认证角色和责任 138
6.2.4 国际上数据空间的认证框架 141
6.3 参与者认证 142
6.3.1 参与者认证维度 142
6.3.2 参与者评估的级别 143
6.4 数据空间核心组件和运行环境认证 144
6.4.1 核心组件认证的三个级别 144
6.4.2 核心组件认证 146
6.4.3 核心组件运行环境认证 147
6.5 认证流程和认证过程 147
6.5.1 认证流程 147
6.5.2 认证过程 148
6.6 本章小结 149
参考文献 149
第Ⅲ部分 数据互操作与共享生态建设
第7章 数据连接器 153
7.1 数据连接器概述 153
7.2 数据连接器的架构、功能与互操作性 155
7.2.1 数据连接器的架构 155
7.2.2 数据连接器的功能 157
7.2.3 数据连接器的互操作 15
试读
第1部分可信数据空间概论
数据是数字化、网络化、智能化发展过程中形成的重要资源,是新型生产要素。数据要素流通是培育数据要素市场的基本前提,是推动数字经济发展的必然要求和核心引擎,是促进数字政府持续长效运营、激活政府公共数据的社会化价值和市场化潜力的重要手段。与此同时,数据如何高效、安全地共享和流通,成为制约数字经济发展的关键因素 。数据空间的建设目标是,以数据高效流通与共享利用为导向,以实现数据的供需匹配为目标,推动数据价值链上下游多元主体和多源数据的汇聚融合,从而实现价值共创。因而,数据空间作为一种创新的数据(主权)管理、流通与共享机制,正逐步成为解决这一问题的有效方案。
数据空间是一个新兴概念,是一个总括术语,指涵盖数据模型、数据集、本体、数据共享合同和专业管理服务等的数据生态系统,以及与之相关的软能力(即治理、社会互动、业务流程)。数据空间既是多组协议,也是数据共享的辅助技术基础设施。截至2024年5月15日,Data Space Radar公布了160个数据空间项目案例,其中,2023~2024年增幅*大,新增近40个。从数据空间的分布领域看,制造业/工业4.0领域的数据空间案例*多,占比19%;能源领域次之,占比14%;移动领域占比10%,智慧城市领域占比为9% 。从整体上看,各领域的数据空间的建设目标具有较高的一致性,通过提升数据空间内数据的互操作性和可获取性,促进数据流动、交易和共享,激活产业的数据驱动型创新。那么,什么是可信数据空间?为什么我国发展数字经济,发展数据要素市场,提出要建设可信数据空间?可信数据空间有什么特征,与数据云、数据中心、数据开放平台等有何区别和联系?数据空间具有什么架构、功能,以及由哪些组件构成?等等,都是人们关注的问题。
本部分通过对数据空间的内涵、特征、体系架构、关键技术和核心组件的论述,让人们对数据空间有整体的认识。
第1章可信数据空间概述
数据和信息共享,一直以来都是人类的愿望。特别是20世纪80年代,互联网诞生之后,这种愿望更加强烈。美国马克卢普(F.Machlup)教授,在1962年出版的信息经济的**论著《美国的知识生产与分配》中提出“知识产业”和“信息经济”的概念,并指出信息产业在美国国民经济中的重要地位。后来,随着信息技术的发展和互联网的普及,信息经济逐渐成为一个被广泛研究和讨论的话题。
2005年,美国计算机科学与技术领域的专家迈克尔 富兰克林(M.Franklin)等从现实需求(如何实现跨域异构数据的集成与共享)的角度出发,提出数据空间(DataSpace)的概念[1],指出组织(如政府机构、企业、家庭)的正常运转依赖海量跨域、异构又互相关联的数据源,从而将数据空间定义为一种涵盖特定组织全部相关信息的数据共存方法,采用数据集成、数据虚拟化、语义建模和元数据管理等技术统一组织管理数据,提供数据编目和浏览、搜索和查询、更新和监控、事件检测和支持复杂工作流等服务。
1.1数据空间的内涵
随着数据空间相关理论研究和实践的不断发展,数据空间的内涵也发生了很大变化。已经从早期的对异构数字资源的融合共存技术,延伸为数智融合环境下,新型数据关系、数据权益保障、数据信任机制与合规治理等数据流通和交易制度体系的建构,以及数据安全技术框架、基础设施搭建等系统性问题的探索。
1.1.1数据空间定义
数据空间概念的提出,缘起于对异构数据库的整合。由于传统数据库技术无法满足跨域、异构、海量、不确定性数据管理的需要,美国计算机科学与技术领域的专家迈克尔 富兰克林等,于2005年比较系统地提出了数据空间的概念。所以,目前业界通常认为,数据空间概念*早于2005年由美国计算机科学与技术领域的专家迈克尔 富兰克林等提出。也有部分研究认为,数据空间概念,*早由德国弗劳恩霍夫协会(Fraunhofer-Gesellschaft)于2014年提出,旨在解决工业领域数据安全共享与互操作性问题[2]。德国Gaia-X协会认为,数据空间是基于公共政策、规则和标准的,联邦、开放的主权数据共享基础设施,并将数据空间定义为“受信任伙伴之间的数据关系类型,每个伙伴都对数据的存储和共享应用相同的高标准和规则”。在数据空间中,数据不是集中存储的,而是在源代码上存储的,只在必要时进行共享(通过语义互操作)。2020年,欧盟委员会发布《欧洲数据战略》指出,欧洲数据共享空间是指由跨越部门、组织和地理界限的众多不同空间组成或连接在一起的空间。数据空间也可被视为数据生态系统的总称,其发展受益于数据安全与共享技术、合适的监管框架和创新的业务模式。
数据空间作为一个新兴概念,提出时间不久,且*近几年才受到广泛关注。因此,客观上说,目前数据空间的相关研究和建设还很少。有关项目也多停留于概念规划、设计和探讨阶段。不过,关于多元异构数据集成、整合、共享等问题已有很多研究。
关于数据空间