第1章 馆藏资源组织的理论溯源及技术发展
馆藏资源的组织与检索问题一直以来都是信息资源管理领域的焦点与核心问题,随着馆藏资源载体形态的不断变化,其组织工具与管理手段也都发生了巨大的变革,其中最主要的特征是从纸质馆藏资源组织工具到以计算机、网络为工具的馆藏资源组织的转变。然而,无论组织工具与管理手段发生何种变化,馆藏资源组织的核心内容都始终围绕着对馆藏资源特征的有效揭示展开。回顾人类对馆藏资源的揭示历程,书目记录的手工操作向机器操作、人工理解向机器理解转变是发展的主流趋势,馆藏资源语义特征的揭示和描述已经成为在语义网推动下馆藏资源组织与检索领域不可回避的重要问题。拟从馆藏资源组织、语义网及关联数据三方面追溯馆藏资源元数据语义描述的理论思想,以此构建基于关联数据的馆藏资源元数据语义描述模型。
1.1 馆藏资源组织的思想缘起
人类被信息淹没,但渴望知识。知识是人类智慧的结晶,对知识进行有效的组织是对其进行发现、利用、再创造的前提,人类文明史的进程一直伴随着对知识组织的探索和追求。从古人的《别录》《七略》《通志?校雠略》《校雠通义》,以及《四库全书》中经、史、子、集分类法的应用到当代的分类法、主题法、元数据、叙词表、概念图、主题图、本体等,无一不是在不同历史时期对知识组织进行的探索和尝试。面对当前信息资源极度膨胀的泛在网络环境,人类对于信息资源的组织与序化需求变得越来越急迫。新时期、新环境下的知识组织将何去何从是萦绕在无数信息科学工作者头脑中的重大问题。尽管当前学术界对知识组织领域的研究已将智能化组织、语义化揭示、可视化表达等作为前沿方向做了大量的开创性研究工作,但是鲜有学者对知识组织的理论根源性问题、发展过程中的认知路径问题做一个系统化、体系化的深入研究,这些基础性研究问题对于构建完善的知识组织学科体系而言具有重要意义。本章则以史学的视角对知识组织理论的产生、发展及演进历程进行深入剖析,以期对本领域研究有全景视图的把握。
互联网和计算机的出现与普及颠覆了原有的、人们已经认可和接受的传统知识组织体系,网络数字资源的几何级数增长趋势也使得传统的知识组织系统与工具陷入缺少灵活性、适应能力不强的尴尬困境,图书馆对于信息资源掌控的绝对权威地位受到了万维网的严峻挑战,由此也引发了万维网技术的拥护者与图书馆学界此起彼伏的口水战。尽管争论的结果并没有影响图书馆事业的发展进程,但是,每一个图书馆人也不禁陷入沉思:高新技术是否应该广泛进入图书馆阵营?如何通过高新技术的应用更便捷、更高效地为图书馆的用户提供全方位服务?Web 2.0所倡导的知识平民化、大众化的理念将促使人类为网络知识组织的科学化投入更多的关注,而知识组织理论、方法、工具也将更加顺应互动式网络的变革,变得更加灵活化、多元化、草根化。语义Web时代的到来使英国情报学家布鲁克斯提出的“知识地图”美妙图景从空中楼阁接上了实践之地气,使其所想逐渐呈现为一幅幅美妙绝伦的知识图谱,然而知识组织的未来依然布满荆棘,需要我们披荆斩棘不断创新才能使知识组织的理论体系更加完善、知识组织的工程实践更加科学、知识组织的服务形态更加丰富。
从知识组织的学科体系、理论思想、实用系统、表示工具这四个横向维度对知识组织的演进历程进行时间序列的深入剖析。分别揭示出知识组织学科体系的“文献组织→情报组织→信息组织→知识组织”的演化路径;理论思想的“线性结构组织思想→树形结构组织思想→盒状结构组织思想→链式结构组织思想→网状结构组织思想”的演化路径;实用系统的“词表系统→分类与归类系统→关联网络系统”的演化路径;表示工具的“纸质媒体时代的表示工具→机读目录表示工具→互联网时代的表示工具→语义Web时代的表示工具”的演化路径。
追溯知识组织的源流,在铸造人类文明的历史长河中蕴含着众多先知对知识组织理论的探索和追求,这集中体现在《别录》《七略》《通志?校雠略》《校雠通义》这几部经典著作,以及《四库全书》中经、史、子、集四部分类法的实践应用中。
(1)在我国,知识组织思想的萌芽出现在西汉成帝河平三年(公元前26年),杰出的学者刘向、刘歆父子受命主持了我国历史上第一次大规模整理群书的工作。在每一部书整理完毕时,刘向便撰写一篇叙录,记述这部书的作者、内容、学术价值及校雠过程。将这些叙录汇集成书便成为我国第一部图书目录《别录》;刘歆在其父刘向的基础上继续整理群书,并把《别录》各叙录的内容加以简化,并将所有的叙录分为六略,即六艺略、诸子略、诗赋略、兵书略、术数略、方技略,再在前面加上一个总论性质的“辑略”,编成了我国第一部分类目录《七略》。《七略》是一部分类目录,第一次展示了我国古代的图书分类方法,它以学术性质作为分类标准。在著录上确立了较为完全的著录方法,除编撰有内容提要外,还利用了“互见法”和“分析法”。《七略》创立的分类法和著录法对我国图书目录学的发展产生了深远影响。
(2)继《别录》《七略》之后,南宋著名的古典目录学家郑樵利用整体论、类例论、记录论、揭示论的目录学思想提出了一系列书目方法论,他的古典目录学核心思想集中体现在其所著的《通志 校雠略》中(王国强和柯平,1996):①整体论是郑樵目录学的指导思想,该思想来源于中国文化——“会通”这一基本精神,“会通”即整体,整体是存在的基本元素,个体由整体分化而来,同时也必须依附、顺从于整体才有价值。“会通”关注的是事物之间的联系性、连续性和全局性。这种指导思想决定了郑樵目录学思想的一切层面,乃至于出发点和归宿。②类例论是郑樵目录学思想的核心,尽管“类例”一词在郑樵的《通志?校雠略》中并没有明确界定,然而从后人对其学术观点的深度剖析来看,“类例”与“分类体例”差可相近,即“类例”既体现出学术分类之意,也包含图书分类之意,郑樵的类例思想旨在使书目担当起更多更重要的文化责任。③记录论表明郑樵认为书目的基本作用是记录和整序文献,不但要记录书籍,还要记录图谱,郑樵认为“见书不见图,闻其声不见其形;见图不见书,见其人不闻其语”。可见,郑樵记录图、书的理念不仅体现出穷尽上下古今文献的思想,更是英国情报学家布鲁克斯所指“知识地图”的思想本源。④揭示论认为文献揭示思想的核心是“泛释无义”,指出文献揭示应当“取简而易晓”“盖有应释者,有不应释者,不可执一概而论”,而不应该“每书之下,必著说焉”(王国强和柯平,1996)。
(3)乾隆四十四年(公元1779年),清代学者章学诚在郑樵学术思想的基础上撰写了《校雠通义》,并提出“辨章学术,考镜源流”的思想。其贡献在于借用学术分类和学术史的方法对传统的书目编排进行创新,完善古籍目录、优化目录质量,对文史目录学的发展和研究具有划时代的意义(王琰,1998)。“辨章学术”是将各科目依学术性质划分清楚、排列在一起;“考镜源流”是提取古今学术发展的史料,通过比较鉴别,溯其源流和变化。章学诚借用学术分类和学术史的方法改革书目编排,完善古籍目录、优化目录质量,把文史目录学研究引入较高的学术领域,提高了文史目录的使用价值,实现按类找书、以书助学的使用价值(王琰,1998)。
(4)1772 年开始清代乾隆皇帝在“文字狱”的背景下亲自组织了中国历史上一部规模最大的丛书《四库全书》的编撰,经十年编成。丛书按照经、史、子、集4部共44类66属对中国国学经典名著进行分类组织,其中经部收录的是儒家经典,史部主要是各种体式的史书,子部收集先秦以来诸子百家及释道宗教的著作,集部收录历代诗文集、文学评论及词曲方面的著作。
倘若,我们用“文献组织”对这段历史时期知识组织的实践探索定义标签的话,那么知识组织的产生与发展则应该推进到20世纪20年代末了。
知识组织概念由美国著名图书馆学家、分类法专家布利斯(H. E. Bliss)于1929 年首次提出,并出版著作《知识组织和科学系统》《图书馆的知识组织》,随后引发图书情报领域学者的广泛关注。美国著名图书馆学、目录学家谢拉(Jesse Hawk Shera)分别于1965年和1966年出版《图书馆与知识组织》《文献与知识组织》两部论著,对图书馆的知识组织表现及作用进行了初步研究(李雷和张亚茹,2012);1964 年我国著名文献情报学家袁翰青教授将知识组织概念引入我国图书情报学界,由此引发了以王知津(2009年出版《知识组织理论与方法》)、蒋永福、王军(2009年出版《数字图书馆的知识组织系统——从理论到实践》)等为首的大批学者对该主题领域广泛而深入的研究,极大地推动了我国知识组织研究与国际前沿的接轨(吴晖和徐丹琪,2007)。
1.2 知识组织理论思想的演进历程
现代意义的知识组织理论基础来源于对一切显性与隐性知识描述和表达的理论与方法,是一个多维的概念。符号学学者史密拉格利亚(Smiraglia,2005)认为知识组织不可能仅靠独立的理论基础就能对智力资本和物理实体进行科学的组织,计算语言学、认知科学、计算机理论、社会认知论、逻辑学、模式科学等都会对知识组织的理论构建起到相应的影响。追溯本源,这些众多的理论思想来自知识组织与信息检索理论衍生进程中的两大经典流派:一是解释性流派,包括社会认知方法、符号学、语用学和历史主义方法等;二是描述性流派,包括认知科学、计算机、语言学及概念理论等。对知识组织理论的形成起到核心支撑作用的则是分别来自两大流派的符号理论及概念理论。随着知识组织系统构建的不断完善,这两大理论基础逐渐走向趋同的集成化发展态势,使知识组织的理论研究进入新的历史阶段。
1.2.1 知识组织的符号理论基础
符号理论是知识组织解释性理论流派的主要代表,而“符号”作为一种描述知识的重要工具,其表现形式多种多样,可以通过词语、图像、图片等各种形式呈现,然而学术界对符号的界定并不严格。对“符号”这一术语的首次描述可追溯到古希腊时期,认为“符号”与“症状”存在必然的联系,且这两个术语都来自“记号”这个语词。到了19世纪,随着关注学科的界限越来越分明,关于对“符号”本质的探讨也逐渐衍生出两个方面的理论体系,分别是以瑞士语言学家索绪尔(Ferdinand de Saussure)为主要代表的语言符号理论和以美国哲学家皮尔斯(Charles Sanders Peirce)为主要代表的符号学运行理论。然而,对知识组织理论体系构建起到重要支撑的则是皮尔斯的符号学运行理论。
皮尔斯的符号学运行理论是一个具有解释功能的前后连贯的系列过程。皮尔斯将其理论定义为三元组成分,分别为“对象”“替代”“解释”,对象即要描述的客体,替代即用于描述该客体的其他表达形式,解释即对象与替代之间的关系,能够对它们起到沟通调节的作用。三元组成分是构成皮尔斯符号学运行理论的最基本单元。符号的含义也就被各种解释的形态来描述其所揭示的客体对象。个人心理解释的反应则被已经广泛接收的符号属性来决定,最终,符号含义的选取是临时的也是不完整的,它们之间的沟通则主要依赖于彼此之间的共同点。
皮尔斯将其符号运行理论体系按纵向和横向分别界定为三个维度,横向维度则按“对象”“替代”“解释”三元组成分对符号进行分类,如图1-1所示。
图1-1 皮尔斯的符号运行理论体系
“对象”“替代”“解释”这三个元素可分别从其表现形式上分为三级概念,第一级“对象”可理解为潜在级,第二级“替代”可理解为存在级,第三级“解释”则可理解为智力概念级,它是对“对象”进行“替代”的逻辑解释说明。