内容简介
《科学数据开放共享:从权属界定到管理体系构建》初步探讨了科学数据的权属界定,全面阐述了科学数据质量管理体系的构成,详细介绍和比较了科学数据的分级分类规定,揭示了科学数据多层级的安全管理责任体系,深入剖析了全球著名科研机构构建科学数据管理体系的实践与特征,考察了典型国家和地区科学数据开放共享的政策实践,在系统回顾我国科学数据开放共享政策演进的基础上,就进一步完善我国科学数据开放共享政策体系提出了建议。
目录
目录
序一 i
序二 iii
前言 v
**章 科学数据与开放共享 1
**节 科学数据的定义与特点 2
第二节 科学数据从共享到开放共享 7
第三节 科学数据开放共享的基本原则 9
第四节 科学数据开放共享的相关政策议题 16
第二章 科学数据权属界定 23
**节 数据权属和科学数据权属的概念 24
第二节 科学数据权属界定的困境及其解决思路 26
第三节 资助机构对科学数据享有的具体权利 31
第四节 大学对科学数据享有的权利 33
第五节 研究人员对研究数据享有的权利 36
第六节 科学数据确权时需要考虑的其他主体权益 45
第三章 科学数据的质量管理 47
**节 科学数据质量管理的内涵与构成 48
第二节 科学数据的生命周期模型 51
第三节 基于生命周期的科学数据质量管理体系 60
第四节 科学数据质量管理的组织体系和人员培养 78
第四章 科学数据的分级分类管理 85
**节 科学数据分级分类的依据 86
第二节 国外大学对科学数据的分级分类 88
第三节 对国外大学科学数据分级分类的比较分析 97
第五章 科学数据安全管理的责任体系 101
**节 政府科研主管部门的科学数据安全管理责任 102
第二节 科研项目资助机构的科学数据安全管理责任 105
第三节 科学数据中心的科学数据安全管理责任 108
第四节 科研组织的科学数据安全管理责任 110
第五节 我国科学数据安全管理责任体系存在的问题和完善建议 117
第六章 构建科学数据管理体系的机构实践—来自NIH和CNRS的经验启示 121
**节 构建科学数据管理体系的制度和组织准备 122
第二节 基于数据生命周期的管理体系建设 124
第三节 运行数据管理体系的关键要素分析 130
第四节 对我国科研机构建设数据管理体系的启示 135
第七章 典型国家和地区促进科学数据开放共享的政策与实践 139
**节 美国 139
第二节 英国 155
第三节 日本 159
第四节 欧盟 168
第八章 中国科学数据开放共享政策演进与体系构建 175
**节 我国科学数据开放共享政策的发展历程 177
第二节 当前我国科学数据开放共享政策体系特征与不足 181
第三节 进一步完善我国科学数据开放共享政策体系的建议 185
试读
**章科学数据与开放共享
诞生于16世纪的近代自然科学,开启了通过实验来描述和解释自然现象的研究范式。数百年来,科学不断涌现出新的领域和学科分支,计算科学的出现开始了对复杂自然现象的仿真模拟,改变了传统的实验科学方法。模拟生产出大量数据,实验科学面临巨量的数据增长,科研活动正在发生变化,新的研究范式将理论、实验和计算仿真统一起来,由仪器收集或仿真计算产生数据、由软件处理数据、由计算机存储信息和知识,科学家们开始通过数据管理和统计方法分析数据和文档。今天,科学的世界正在从实验科学步人数据科学。人类基于系统的数据观察,在对所采集并仔细保存的实验数据进行挖掘和分析的基础上建立起新的理论,提出新的研究成果,数据密集型的科学范式概念自然而生。《第四范式:数据密集型科学发现》①一书将这一以大数据为基础的数据密集型科学(data-intensive science)研究,称为继实验科学(experimental science)、理论科学(theoretical science)、计算科学(computational science)三种科研范式后,科研人员进行科学研究及科学发现的“第四范式”。
**节科学数据的定义与特点
一、科学数据的定义
关于科学数据,目前国内外尚未形成一个统一的内涵界定,有的政府文件中使用“研究数据”(research data)这一概念,也有大学或科研机构使用“科研数据”(scientific data)这一称谓。本书选取国内外比较有代表性的科研机构对科学数据的相关定义,具体见表1.1。OECD将研究数据解释为:数据研究基本来源的实时记录(数值、文本记录、图像和声音),被科学团体共同接受的对研究结果有用的数据?。美国OSTP将研究数据定义为:科学界普遍接受的用以验证研究结果的数字记录事实材料,包括用于支持学术出版物的数据集②。哥伦比亚大学《研究数据保存指南》认为,研究数据是指任何在相关研究领域内被广泛接受的记录信息,这些信息既反映了通过大学研究调查所获得的事实,也是重建和验证大学研究结果,以及探究导致这些结果的事件和过程所必不可少的,无论其以何种形式或媒介进行记录。研究数据包括无形数据(如统计数据、研究发现、公式等)以及有形和数字形式的数据(如实验笔记本、研究协议、病例记录等)③。我国《科学数据管理办法》将科学数据定义为:在自然科学、工程技术科学等领域,通过基础研究、应用研究、试验开发等产生的数据,以及通过观测监测、考察调查、检验检测等方式取得并用于科学研究活动的原始数据及其衍生数据①。从本质上看,科学数据、研究数据以及科研数据并无太大区别,为了避免概念的混淆,本书将研究数据和科研数据统称为科学数据。
比较上述定义可以看出,国内外对科学数据的理解存在着差异,主要分为结果视角下的科学数据和过程视角下的科学数据。从结果视角来看,科学数据主要是以数字形式记录的,用来验证和检验研究发现的一些真实资料。因此,科学数据侧重于研究过程中直接产生的、用于验证研究过程的可重复实验的原始研究数据,OECD、OSTP等国外机构主要从结果视角阐述了科学数据的概念和内涵。从过程视角来看,科学数据涵盖了广泛的数据类型,不仅包括原始实验结果、仪器输出、用于收集和重构数据的相关协议、数字、图形等资料,还包括在研究过程中获得和衍生出来的数字校稿、文本记录、图像、声音、软件和模型等数据①。因此,过程视角下的科学数据的内涵更加丰富,除了包括在传统条件下“理论预测+实验观测”科研过程中所产生的实验观测结果之外,还包括将科学研究对象(包括社会科学领域)以计算机仿真和模拟分析等方式产生的数字表达,以及从原始数据(包含数字表达对象)到中间数据*终到研究结果的科学工作流②。
本书中“科学数据”这一概念,根据国内外应用情境的不同,在指代上略有差异。在介绍国外经验的部分,科学数据主要是指在国外政策语境中,基于结果视角的研究数据或科研数据;而在其他部分,则主要指基于过程视角的广义科学数据,即被收集起来并作为推理、讨论或计算基础的所有信息,特别是事实或数字。广义科学数据既包括科学研究过程中直接形成的原始数据,又包括与科学研究相关的、助推科学研究活动的文件、调查结果、音/视频记录等衍生数据。
二、科学数据的特点
科学数据是国家科技创新和发展的基础性战略资源。随着大数据时代的到来,科学数据日益呈现出4V特征,并具有巨大的潜在价值和可开发价值③。
(一)科学数据体量(volume)大
目前存在着大量从宏观到微观、从自然到社会的观察、感知、计算、仿真、模拟、传播等设施和活动中产生的科学数据?,这些数据在科学技术研究、试验开发等过程中通过观测、调查等方式获取,并用于科研活动的原始数据及其衍生数据。在大数据背景下,科学数据的产生已从之前实验室中单一设备采集的个体数据转变为通过广泛分布的传感器、摄像头等设备采集的海量数据②。王