第一篇概念篇
第1章开放科学与开放科学平台
1.1开放科学概述
联合国教科文组织(UNESCO)[1]认为,开放科学是“结合了多种运动和实践于一体的总括性概念”“旨在实现科学知识、方法、数据和证据的人人可及、公开使用、免费获取和重复使用,以科学协作和信息共享的方式增进科学传播和社会福利,并向传统科学界以外的社会行为者开放科学知识的创造、评估和传播过程”。开放科学是一个包容性框架,描绘了开放化的信息化基础环境,涵盖了多学科领域的学术实践活动,而且需要科研人员、研究机构领导者、出版商、资助方、学术团体等众多行为者深度参与。开放化环境涵盖了以硬件设施为主的“硬”服务环境、以软件和数据为主的“软”服务环境及协同工作环境、运行维护平台等运管环境[2],以数据与计算平台为例,其具备融合、协同、智能、安全、开放等特点,可满足共享需求、提供共享服务、支撑科研活动,是驱动当代科学研究发展的重要信息化基础设施[3]、解决复杂科学问题的必然选择[4]。图1.1展示了开放科学概念的关键要素。
开放科学始于科学本身,实践于社会大众,服务于国家战略,其*终目标是加速科学探索进程和实现共同利益*大化,通过促进更多透明、开放和协作来拓宽科学研究的边界和增强科研成果的价值,影响整个科学研究周期及其利益相关者,具有十分重要的意义。
(1)在科学层面,开放是保障科学研究可靠性、可重复性与开放包容性的基石。开放科学描述了研究开展方式、研究人员合作方式、知识共享和科学组织的形式,从根本上改变了学术研究的信息传播模式,*大程度消除了学术信息流动障碍,有助于利用集体智慧开展科学研究。
(2)在社会层面,开放科学体现了平等和自由思想,可为社会提供更高层次的社会福利。开放科学让各社会阶层群体都可以接触到科研的前沿思路和科学实验,发挥自身专长理解科研成果;开放科学使得组织成员对研究成果的获取和传播更加便捷,开放科学运动也使得他们的积极倡议和付出得以回报。
(3)在战略层面,开放科学将促使学术研究的透明性、责任性、包容性、协作性和可复制性提升。一方面科研全过程得以校验,另一方面开放包容的科研文化得以孵化、民众的科学素养得以进一步增强。科学家精神的传承和民众科学素养的提升将助推国家向着科技强国不断迈进。
图1.1开放科学的内容要素
当前,开放科学理念已成普遍共识,2021年2月李克强总理在外国专家座谈会上指出全世界科学界都应该坚守这样一个理念:科学一定要合作和开放[5]。在科学共同体的努力推动下,开放科学取得重要进展。
开放期刊获取方面,先后发布《布达佩斯开放获取倡议》(2002)、《贝塞斯达开放获取出版宣言》(2003)、《OA2020:大规模学术期刊开放获取倡议》(2016),建成了arXiv、medXiv、BioXiv、engrXiv、ChemRXiv等预印本平台,开展了开放获取周(OAWeek)系列品牌活动、启动了“S计划”(PlanS),基本形成绿色OA、金色OA、混合OA、棕色OA、黑色OA等五种模式。其中,我国于2018年初发起了以推动中文科技期刊创新能力为宗旨的“开放科学计划”(OSID),目前已吸纳数百本期刊加入[6]。
开放科学数据方面,《Earth SystemScience Data》《Scientific Data》《Geoscience Data Journal》《Polar Data Journal》《中国科学数据》等为代表的数据期刊成为科学数据出版的创新载体,以国际科学理事会数据委员会(CODATA)、研究数据联盟(RDA)等为代表的国际组织通过国际会议交流、制定政策标准、发起活动倡议等活动推动科学数据开放共享。我国出台的《科学数据管理办法》(2018)首次站在国家高度、面向多领域科学数据提出开放共享的指导原则[7],布局20个领域科学数据中心(2019)构建国家科学数据共享服务网络体系[8]。
开放基础设施方面,美国启动了“国家信息基础设施”计划(1993),成立了非营利组织“开放科学中心”(2013);英国将建设“国家核心基础数据集”作为国家数据战略之一(2012)、启动“国家信息基础设施”项目建设(2015)、启动“国家基础设施交付计划(2016~2011)”(2016);由全球10多个国家计划合资建设的平方公里阵列射电望远镜(SKA)将是人类有史以来建造*大的望远镜;我国于2002年着手建设了覆盖中国科学院全院科研院所和职能部门所有业务场景的学术资源规划系统(ARP)[9],持续建设“中国科技云”并牵头发起了“全球开放科学云”计划(2019)。
开放科学战略方面,荷兰制定了《开放科学与研究计划》(2014),启动开放科学国家计划和发布《荷兰开放科学宣言》(2017);日本发布了《促进日本开放创新、开放科学、向世界开放》研究报告(2015);法国发布了《法国开放科学国家计划》(2017);美国发布《开放科学设计:实现21世纪科研愿景》报告(2018);塞尔维亚通过了《科学与研究新法》(2019);芬兰、联合国粮农组织、欧盟、波兰、联合国教科文组织、加拿大等国家/组织还发布了涉及不同方面的开放科学路线图。我国则提出了“推动实施国家大数据战略”(2015),强调加快完善数字基础设施,而《“十三五”国家信息化规划》(2016)则将数据资源开放共享作为一项行动计划列入优先实施范畴。
1.2开放科学平台
所谓开放科学平台,是指将实验室、大科学装置、科研数据中心、信息化平台、分布式网格等基础设施统一整合后进行开放共享[10]。经过多年发展,开放科学平台基本形成了开放获取平台、开放数据平台、综合型平台三种类型。
1.2.1开放获取平台
1.欧洲开放获取基础设施
2009年,欧盟启动欧洲开放获取基础设施(OpenAIRE)建设[11],负责已存在的、已计划的和将来建设的知识库或相关的基础设施所产出的研究成果(出版物、相关数据集、软件和服务)的整体管理、分析、操作、提供、监测和交叉链接。OpenAIRE既是一个专门的开放科学专家网络,旨在推广和提供开放科学培训,又是一个技术基础设施,用于收集连接数据提供商的研究成果。对于欧洲公共资金资助的研究成果,平台将提供无限制、无障碍、开放式的访问,致力于为欧洲及其他地区开放的学术交流提供支持,努力建设一个*先进、开放和可持续发展的学术交流基础设施,促成对于科学研究的完整价值的全面的无边界的开放获取。目前,经历OpenAIRE、OpenAIREPlus、OpenAIRE2020、OpenAIRE-Connect等迭代后,已经发展至OpenAIRE-Advance,服务延伸至研究社区,与欧洲开放科学云(EOSC)相兼容,以支持欧洲和全球的开放获取/开放数据任务。
2.拉丁美洲科学出版物机构存储库联邦网络
2012年,阿根廷联合其他9个国家发起建设拉丁美洲科学出版物机构存储库联邦网络(LA Referencia)[12],这是一个开放获取存储库网络,旨在通过一个具有互操作性标准的平台为拉丁美洲的国家开放获取战略提供服务支持,从国家层面整合、分享并宣传高等教育和科学研究机构产生的科学成果(科技文献、博士/硕士学位论文)。在技术层面,LA Referencia开发了一个免费软件平台GPL3收集科研信息,该平台除了支持区域网络的中心节点之外,还充当成员国的聚合服务和国家门户;在标准层面,LA Referencia通过其“元数据和收获政策”(2015)文件确定了所考虑的都柏林核心元数据方案的14个要素中每个要素的性质、定义和范围;在协议层面,基于欧盟的《Driver2.0准则》和《文献资料库管理者OpenAIRE准则》构建了一系列多语言控制的词汇表和互操作性指南,实现词汇表和准则要素在更大程度上的国际统一。目前,LAReferencia联邦网络已汇聚阿根廷、巴西、智利、哥斯达黎加、哥伦比亚、厄瓜多尔、萨尔瓦多、墨西哥、秘鲁、乌拉圭等10个国家的一百多所大学和研究机构的310万条文件资料、105万篇硕博士学位论文、20万篇科学文章和7万条科学报道。
3.其他科研资源开放网络
除了上述开放获取基础设施,国际上还有其他诸多科研资源开放网络平台,表1.1对部分典型案例进行了梳理。
展开