第4章 地球系统科学数据共享互操作研究<br> 4.1 地球系统科学数据共享平台体系<br> 4.1.1 分布式数据共享平台体系分析<br> 科学数据共享技术上可采用两种方法:一种是将数据资源用硬盘或光盘拷贝进行交换;另一种则是依赖计算机网络进行共享。目前,国际上在科学数据管理和应用中的发展趋势是充分发挥计算机网络的功能,在共同遵守数据共享的原则下建立全球性和区域性的数据网络,与此同时集中建立若干数据中心,系统采集整理存储数据,使网上数据源不断增加和完善(李晓波等,2003)。本书讨论的数据共享也是基于计算机网络的数据共享。基于网络的数据共享存在两个方面的问题:一是数据资源在物理上分布,而且格式和类型多种多样,服务的方式也不一样,有的是以文件的形式存储,有的则存储在数据库中,有的通过系统对外提供服务;二是用户是分布的,每个互联网的接人者都可以成为数据共享的用户,他们的背景、教育程度、熟练程度等相差很大。因此,为了能够整合集成这些分散的数据资源,为互联网上众多的用户提供数据共享服务,必须采用一种分布式的数据共享体系。分布式数据共享体系由多个节点共同组成并统一为用户提供数据共享服务,这些节点是按分布式软件体系统一进行部署的,也可能是已有的数据共享服务系统。<br> 关于分布式数据共享平台体系,国内外学者进行了大量的研究,其中,应用最广泛的是数字图书馆、电子商务和电子政务领域。在图书馆界使用最多的是Z39.50协议和OAI跨库检索。Z39.50协议的全称是informational retrieval ser。vice definition and protocol specifications for Iibrary applications,它是一个国际标准(ISO 23950),定义了一种计算机到计算机的信息搜索协议,使得用户能在一个系统中查询和取得另一个计算机系统(同样遵循z39.50协议)的信息,而无需另一个系统的查询语法。z39.50是一种基于网络的信息标准,它允许用户检索远程数据库,但不局限于检索书目数据,在理论上可用于检索各种类型的数据资源。Z39.50产生于图书馆界,最初的目的是为了提供联机公共书目数据检索。至今,图书馆界仍然是Z39.50的主要应用领域之一。在互联网上,存在着大量的Z39.50服务器,这些服务器连接着世界上许多大型图书馆的馆藏书目数据。
展开