第4章 面向科学一技术关联探测的
专利引文降噪
科学一技术关联探测的过程是对科学与技术两大系统之间知识流动进行追踪与捕捉的过程。科学论文与技术专利之间的引用关系是二者间实现知识传输的通道和实现知识衔接的桥梁。如同科学引文分析已成为探测科学知识关联的重要途径一样,专利引文分析也正日益成为探测科学.技术关联的重要手段。
4.1 科学引文分析与科学知识关联探测
随着SCI的广泛应用,科学引文分析的基本思想和原理已被广泛理解和认同。早在1964年Garfield就手工完成了DNA领域的引文编年图,随后Price于1965年运用相同数据完成了经典论文《科学论文网络》,这两个事件成为了利用引文分析法进行知识关联探测的开端。之后,Garfield在计算机技术的辅助下,于1974年绘制了生物医学领域各主要课题图谱、揭示了各课题之间的知识关联关系,从而反映出生物医学研究的内部知识结构。
Egghe(1994)认为,一篇科学论文不是孤立的,而是存在于所属学科的文献体系中,并通过引文目录指明。一篇科学论文在引文目录中被提及,这说明在著者的思想中,被引文献的部分或全体与施引文献的部分或全体之间存在一种知识关联。Egghe还指出,至少从19世纪以来,科学传统要求科学家在撰写论文时必须参照前人所写的与之相关的论文,通过这些参考文献能够查明作者在构思自己的论文时吸收或利用了哪些早期研究者的概念、方法、设备等。
目前,科学引文分析已成为探测科学知识关联的重要手段,为回溯学科源头,厘清学科发展脉络,发现学科间交叉、渗透及衍生规律,呈现知识网络以及绘制知识图谱提供了有效途径。
科学引文分析的理论基础和逻辑起点是对科学论文引用动机的研究和确认,这也正是科学引文分析方法能够得到公认的前提。关于科学论文的引用动机,经过众多学者长达数十年的研究和争论,学术界已基本达成共识,即科学论文的引用动机中虽然存在批判、商榷等否定型引用动机,但其所占比例很低,大多数科学引文的引用动机如同Weinstock所总结:向前人致敬(credit topioneer),对有关著作给予荣誉(hon01.t0 1iterature),核对作者所用的数据、方法和参数(check data,method,parameters),提供背景阅读材料(background1iterature)等肯定型动机。与此同时,科学论文的引用动机还包括:对自己的著作进行更正,对别人的著作进行更正,评价以前的著作,为自己的主张寻求充分的论证,提供研究者现有的著作,对未曾被传播、很少被引用或未曾被引用的文献提供向导,鉴定数据及物理常数,核对原始资料中某个观点或概念是否被讨论过,核对原始资料或其他著作中的起因人物的某个概念或名词,承认他人的著作或概念,对他人的优先权要求提出争议。Weinstoek还指出,文献的科学论文之间的施引和被引是由科学本身的发展规律和科研活动本身的行为规律所决定的。科学研究反复表明,科学知识具有明显的累积性、继承性,任何新的科学知识总是在知识累积的基础上通过继承、分化、衍生而得来,都是对原有学科知识的发展,也就是说,科学知识的发展是连续的。同时,由于科学的统一性原则,现有的各个学科之间都是彼此联系、相互交叉、相互渗透的。因此,任何一项科学研究都必须是在前人成果的基础上,吸取他人的经验来进行。这样,作为科学知识的记录和科研成果反映的科学论文也必定是相互联系的。在创作科学论文时,作者不可避免地需要引用相关文献,为自己的观点寻找依据、查考资料。在发表科学论著时,作者引用参考文献,一方面是为了说明引用资料的出处,以强调其可靠性,同时也便于读者核对,或在此基础上进行更深入的研究;另一方面也表明作者讲究科学道德,尊重他人劳动。随着社会的发展,标注引文已作为标准的科学行为规范之一被绝大多数科学工作者接受并在实践中遵循。
科学文献间的相互引用是科学发展规律的体现,也是科研活动中普遍存在的必然行为,因此,科学引文分析已成为一种被广泛接受和应用的文献计量学方法——运用数学和逻辑学等方法对期刊、论文、专著等研究对象间的引用和被引用现象进行计量分析,以揭示出研究对象所具有的特征或对象之间关系的一种研究方法。
……
展开