第1章 科研信息化的发展与演进
1.1 科研信息化的概念与内涵
随着人类对客观世界的探索与认识不断向新的深度和广度拓展,现代科学研究无论从微观还是从宏观上都向着更深更广的范围发展。传统的观测实验、理论分析的科研手段在面对很多复杂问题时已经显得无能为力,研究人员迫切需要能对大规模数据进行处理分析、计算模拟和仿真的新的科研方法。随着计算机网络和网格技术的迅猛发展,通信和计算机技术已成为目前科学研究活动的必备手段,对科研信息和科研设备的共享与交流也变得前所未有的重要。分布于世界各地的大型研究团队利用先进的信息技术进行资源共享和协作研究,也更为强调研究人员之间跨单位、跨地域、跨国家、跨学科、跨领域的合作与交流。科研信息化在此形势下应运而生(孙坦,2009)。
1.1.1 e-Science:科研信息化的兴起
1. 英国率先提出e-Science的概念
科研信息化*早得名于e-Science。而e-Science的概念*早是在1999年由当时英国科技办公室(Office of Science and Technology,OST)主任约翰 泰勒(John Talyor)提出的。他认为,e-Science就是在重要科学领域的全球化合作,以及为此提供支撑的下一代基础设施。随后,英国e-Science特使马尔科姆 艾特金森(Malcolm Atkinson)提出,e-Science是指利用先进计算思维研究方法的系统性发展。这些研究方法可使研究人员通过自己的桌面计算机访问广泛分布在各处计算机上的资源,以进行新的研究。这里提到的资源和泰勒所说的基础设施是一个范畴,包括大规模数据集、超级计算或高性能计算资源、高速网络、网格(grid)、共享实验设备等。
2. 从e-Science到e-Research
随着科研信息化的发展与演进,其概念也逐步扩展。例如,澳大利亚就将科研信息化称为e-Research。e-Research一词进一步扩展了e-Science的概念,将后者的范围扩展至包括人类学和社会科学在内的所有研究领域。e-Research旨在开发并使用信息技术支持现有和新兴的研究,其主要特点是协作、数据密集、使用网格计算技术。e-Research包括使用先进信息通信技术的所有研究活动,也包括从网络、服务和工具中发展起来的新兴研究方法论。随着信息技术、高速网络和在线设备的发展,e-Research的概念和e-Science的概念逐步融合。
3. 对e-Science的一些片面理解
在e-Science的发展过程中,对于如何推进e-Science,也曾存在一些片面的理解。一种认识是将e-Science等同于企业资源规划(enterprise resource planning,ERP),可建立一个能把各种科研活动纳入其中的信息系统。事实上,e-Science包括支持科研活动的各种信息化手段,而科研活动具有多样性和过程复杂性,不是一个类似的系统可以进行规范和支持的。但是,科研活动的管理是可以建立类似系统的。
另一种认识是把e-Science简单地当成“网络化的科学研究”。网络化固然是e-Science的重要特征,但e-Science涵盖的内容却要多出很多。一方面,e-Science要求支持科研的基本手段的信息化,另一方面,e-Science应能为当时正在兴起的虚拟科研组织提供支持与各种信息服务。还有一种片面认知,认为e-Science就是以超级计算中心为节点的网格环境。超级计算中心是科研信息化*重要的基础设施之一,能够支持大量科研工作者的高端计算需求,但是e-Science还包括其他各种支持科研活动的信息化手段,有着更为广泛的内涵(桂文庄,2009b)。
1.1.2 我国对科研信息化的认识
e-Science的实质是“科学研究的信息化”,是信息时代中科研环境和科研活动的典型体现。科研活动的信息化是中国科学院(简称“中科院”)信息化的核心。它包括两个基本方面:信息化基础设施和信息化的科研活动。信息化基础设施包括网络、高性能计算(high performance computing, HPC)、科学数据库和数据存储管理设施等服务于科研的基础信息化设施;也包括数字化科研装置、仪器等科研工作者获取数据的基本工具;还包括基于这些设施的应用软件、中间件、工具和服务;此外包括标准、规范、制度、政策、法规以及人才培养等软环境。科研活动信息化针对各领域科研活动的具体需求,在基础资源共享和协同工作的前提下,建立起与之相适应的信息化设施、装备、工具、系统和工作环境(桂文庄,2009a)。
中科院在“十一五”信息化规划研究时提出了e-Science模型。其*底层是宽带网络,它支撑一切基于网络的科研信息流动。其上是主要的科研信息化基础设施,包括数字图书馆、科学数据中心和超级计算中心,它们是支持各类科研活动的共用技术设施,并向用户提供应用公共资源的接口。在其上是各类信息化的科研活动设施和工具、方法,包括大型科学装置、实验室仪器设备、野外观测台站、数字标本馆、移动数字终端等,它们直接服务于各自领域的科研活动。虚拟实验室提供基于网络和所有这些资源的应用环境,为虚拟科研组织或团队的科研活动提供支持与服务,是科研工作者与科研设施间的信息化界面。
1.1.3 新时代科研信息化的内涵与外延
如果抛开信息技术工具论的观点,从信息生产力改造世界的生产关系的角度来分析,科研信息化的本质内涵就是科研生产关系的信息化,是信息生产力在科学生产活动中的实践和应用。新时代的科研信息化是科学研究的对象、工具、环境与活动过程及科研人的信息化。科研信息化对加速原始科技创新,扩大企业协同创新,培育万众群智创新至关重要,其外延即是上述三类创新的主体、对象、工具、环境与活动过程的信息化。
从生产要素来看,科研信息化包括三要素,即劳动者,掌握信息技术和信息化方法的新一代创新者;劳动对象,泛化的物质世界和抽象的虚拟空间及数理空间;劳动工具,实现科研数据从获取、传输、存储、处理到应用的信息工具,包括各类自动化、智能化的软件系统、硬件系统及其构成的平台环境。
从创新主体来看,科研信息化推动了以传统科研院所为主体的学术活动和科研范式的变革。各学科领域不同程度与信息化再融合,出现了新的科研模式。科研信息化使跨领域、网络化的产业协同创新成为可能,使企业创新主体不断释放科技创新力,成为产业链创新的重要载体和国家创新体系的关键要素。科研信息化实现了生产组织方式的去中心化和网络化,将创新主体从研究型大学、科研院所、大型企业延伸至个人,开启大众创业、万众创新时代。
从发展历程来看,科研信息化的发展经历了三个阶段。第一阶段是“工具阶段”,提供纯粹信息技术工具。其主要特征是,科研工作者个体将*新的电子、信息技术等工具应用到自己的研究对象、研究工具和方法中。第二阶段是“环境阶段”,提供更好的信息服务环境。其主要特征是,出现全球性的科研创新网络,引发更加激烈的全球科技竞争。第三阶段是“一体化阶段”,科研对象、过程融为一体。其主要特征是,所有创新主体,必须参与全球科研竞争与协作的大环境,同时创新方法、创新对象、创新模式等方面也将高度依赖物联网、移动互联网、大容量宽带通信、大数据、智能计算等技术工具和协同环境。
从生产活动规律来看,经济学的“长尾理论”同样适用于科研信息化。科研信息化,一方面必须重点建设公共科研信息化基础设施,这类基础设施服务面广、价值高,可满足大多数科研人员及创新主体的主要需求;另一方面,也需要大力建设面向学科领域的特色科研信息化应用,这类应用,可充分发挥现代信息技术对差异化、多样化、个性化需求的支撑作用,满足学科种类众多、科研手段千差万别的科研创新工作的实际需求,这类特色应用服务面小,对该领域科研和创新主体价值高,但其他领域较难直接应用。
1.1.4 科研信息化理论与实践模型
对于科研信息化的认识,基于中科院近20年来持续的理论探讨和实践探索,本书认为,科研信息化是基于先进的信息化基础设施,充分利用“互联网+”“计算技术+”“智能+”,以及云计算、大数据等新一代信息技术,促进科技资源交流汇集与开放共享,提高科研活动效率、催生新的科研范式的过程。
通过长期的探索,本书总结了众多科研信息化的理念与实践经验,提出了规范的科研信息化理论与实践模型,如图1-1所示。
科研信息化理论与实践模型主要包括三个维度:科研信息化要素维度、学科领域维度以及科研范式维度。
科研信息化要素维度。首先是先进的科研信息化基础设施,涵盖硬件、软件和科研资源等投入要素。包括科研高速网络、超级计算机、科学数据存储等;其次是信息化科研要素,包括科研文献、科学仪器、重大科技基础设施、科学数据及野外台站、标本模型等;再者,是科研基础软件,包括工具软件及算法、模型等;*后,是各学科领域的科研应用,是具备支持特定学科领域全周期科研需求的科研信息化平台或系统。这些要素当中还包括各类科研管理的要素。
图1-1 科研信息化理论与实践模型
学科领域维度。信息技术在向学科渗透发展过程中,可以分为四类情况。一是传统的自然科学,如数学、物理、化学、天文、地学、生物等。二是传统的社会科学,如历史、文学、哲学、社会、统计、经济、法律等。三是信息技术和传统学科交叉而产生的交叉学科,往往是计算或者信息学与传统学科的结合,通过构建新模型和算法,实现挖掘新规律或者发现新知识。例如生物信息学(bioinformatics)、计算化学(computational chemistry)、社会信息学(social-informatics)等。四是新兴学科,包括计算机、人工智能(artificial intelligence, AI)、网络空间安全、数据科学等,多数是由信息技术应用以及科研信息化应用而产生的新兴学科。根据2014年对中科院二十多个自然学科和社会学科的调研可知,各领域不同学科的科研信息化程度有差异,呈现高度融合型、适度融合型、应用结合型、松散耦合型等规律性模式特征(王卷乐等,2017)。因此,学科科研信息化程度和诸多因素相关,主要是取决于信息化技术和相应领域学科融合的情况,取决于学科研究对象的信息化程度,也取决于学科人才队伍情况及开放共享文化氛围。
科研范式维度。主要是四种范式,以描述自然现象的实验归纳为主的第一范式,以研究自然规律的理论推导为主的第二范式,以对复杂现象的模拟仿真为主的第三范式,基于科研信息化基础要素,开展定量科学研究的科研信息化范式,也就是第四范式。表1-1总结了各类范式的主要特征、典型研究方法(工具)以及代表性案例。
表1-1 四类科研范式及其实例
科研信息化是新一轮科技革命的引擎和显著特征,已经被无数的科研信息化实践证实。面对方兴未艾的信息化、智能化浪潮和日益激烈的大国科技竞争,必须高度前瞻科研信息化的历史使命,变革我国科研和创新组织及活动模式,大幅度提升我国科技创新能力,切实支撑国家创新驱动发展战略。
“没有革命的理论,就没有革命的行动”。科研信息化的发展,也同样必须要有理论指导。本书研讨提出科研信息化理论与实践模型,希望能够为科研信息化发展提供总体参考,明晰科研信息化发展的战略方向及重点领域,推动当前我国科研信息化发展中诸多问题的逐步解决,促进我国科研信息化的跨越式发展,成为新时期国家创新发展生态的重要组成部分。
展开