第1章 颠覆性技术识别方法研究
当前,全球科技创新进入空前密集活跃的时期,呈现高速发展和高度融合的态势,以颠覆性技术创新为突破口带动全面创新,已经成为科学技术发展和经济增长的重要动力。在国家“十三五”规划纲要首次提出要“更加重视原始性创新和颠覆性技术创新”。《国家创新驱动发展战略纲要》明确提出要“发展引领产业变革的颠覆性技术,不断催生新产业、创造新就业”。党的十九大报告也对颠覆性技术进行了系统部署。在2018年的两院院士大会上,习近平总书记再次提出:“以关键共性技术、前沿引领技术、现代工程技术、颠覆性技术创新为突破口,敢于走前人没走过的路,努力实现关键核心技术自主可控,把创新主动权、发展主动权牢牢掌握在自己手中。”国家“十四五”规划纲要进一步提出,要“在科教资源优势突出、产业基础雄厚的地区,布局一批国家未来产业技术研究院,加强前沿技术多路径探索、交叉融合和颠覆性技术供给”。面向支撑颠覆性技术前瞻性战略布局、引导创新资源聚集、优化资源配置的目标,亟待开展常态化的颠覆性技术识别和预测,实现对技术先机和技术突袭机会的准确判断以及创新主动权和发展主动权的全面把握。
在颠覆性技术创新的前期研究中,本研究组提出了基于“FMPA技术颠覆性潜力评估指标体系”进行颠覆性技术识别的方法,侧重于颠覆性技术的遴选和评估。在此基础上,本书进一步研究了侧重技术预测和发现的颠覆性技术识别方法。
1.1研究方法框架设计
本书提出了一种基于文本挖掘和专家评分的颠覆性技术识别方法,该方法分为两个环节(图1-1)。第一个环节:基于科技信息文本挖掘的思路寻找颠覆性技术“种子”或“萌芽”,即“潜在颠覆性技术”。科技文献中承载着大量新兴、热点和前沿技术的信息,是目前广受认可的高质量技术情报源,可保障技术识别结果的预测性、可回溯性和可验证性,是潜在颠覆性技术识别的核心信息源。通过对文献文本内容的挖掘和情报专家的识别归并与判读,得到领域潜在颠覆性技术清单。第二个环节:构建符合领域特点的“技术颠覆性潜力评价三维指标体系”,采用科技专家主观评分的方式逐一评判清单中各项技术的颠覆性潜力,在此基础上通过综合评估选择领域高潜力的颠覆性技术开展专题研究。该环节并未完全采用客观数据量化计算的方式来进行技术颠覆性潜力评价,原因在于通过文献挖掘识别得到的潜在颠覆性技术数量较多,建立这些技术与相关支撑数据之间的映射关系在现阶段存在困难,同时在该环节引入科技专家主观评分可以更有效地验证定量分析的结果。需要指出的是,虽然基于科技专家主观评分的颠覆性潜力评判方法能够在较大程度上保证结果的科学性和有效性,但是该方法仍旧无法完全避免专家咨询法的识别主观性强、可回溯性弱、受限于专家知识广度等问题。
该方法在能源领域应用的具体实施框架如图1-2所示。第一个环节是“基于科技信息文本挖掘的潜在颠覆性技术清单生成”,即基于能源领域大规模科技信息文本数据(高质量论文、高价值专利和颠覆性技术相关科研项目数据等),引入深度学习和数据挖掘技术,对科技信息进行降维聚合得到主题类簇;同时汇集权威智库机构发布的相关颠覆性技术研究报告数据,通过能源情报专家识别归并和判读,生成能源领域潜在颠覆性技术清单,实现了从海量科技信息中发现颠覆性技术“种子”或“萌芽”,保障了用于科技专家咨询的潜在颠覆性技术清单的客观性和可追溯性。
第二个环节是“基于科技专家主观评分的技术颠覆性潜力评价”,针对能源领域设计了包括科技维度指标、产业经济维度指标和外部环境维度指标的“技术颠覆性潜力评价三维指标体系”,并基于此设计“能源领域技术颠覆性潜力专家调查问卷”进行德尔菲调查,然后综合计算科技专家对潜在颠覆性技术清单中各项技术颠覆性潜力的量化评分结果,以此论证筛选出能源领域高潜力颠覆性技术并开展专题研究。以下对这两个环节的实施细节进行详细介绍。
1.1.1基于科技信息文本挖掘的潜在颠覆性技术清单生成
基于科技信息文本挖掘的潜在颠覆性技术清单生成实施框架如图1-3所示,具体分为数据准备、文本预处理、文本向量化、聚类分析以及专家判读5个步骤。
(1)数据准备。结合目标分析领域的特点,确定本领域的高质量论文、高价值专利和颠覆性技术科研项目数据来源,并从特定的论文、专利、项目数据库中抽取对应的数据。
(2)文本预处理。分别对抽取的论文、专利、项目数据进行术语抽取、停用词过滤、词干化等文本预处理,为后续的数据挖掘做准备。术语抽取可采用基于词典匹配的术语识别方法,停用词过滤可通过领域停用词表过滤,词干化可通过SnowballStemmer等软件工具实现。此外,还需过滤单纯数字、标点符号、空白字符等无效字符。
(3)文本向量化。首先对目标分析领域的大规模语料进行Word2vec模型训练,基于Word2vec模型将论文、专利和项目文本数据向量化。文本向量化的计算步骤为:①由于文本长度不一致,本研究采用特征提取的方法提取关键特征进行文本表示,如采用TF-IDF抽取每个文本的top N关键词;②从Word2vec模型中获取每个词特征的词向量,依次组合形成一个二维数组;③将二维数组的元素逐个求和,形成一个跟词向量长度一致的一维数组Array;④将一维数组归一化,归一化利用一维数组对应的向量模长,
公式如下:
(1-1)
⑤*后得到的stArray为句子向量。
(4)聚类分析。分别针对向量化的专利文本向量、论文文本向量和项目文本向量,采用K均值聚类方法分别进行聚类,并根据轮廓系数遴选*优聚类个数,分别形成高质量论文聚类簇、高价值专利聚类簇和科研项目聚类簇。
(5)专家判读。由能源情报专家结合领域知识,逐个对聚类簇进行解读、归并、提炼、总结,并结合权威智库机构已发布的颠覆性技术研究结果,判读形成能源领域的潜在颠覆性技术清单。
1.1.2基于科技专家主观评分的技术颠覆性潜力评价
基于科技专家主观评分的技术颠覆性潜力评价是在潜在颠覆性技术清单的基础上,由科技专家基于“技术颠覆性潜力评价三维指标体系”(表1-1),根据领域专业认知,通过量化评分的方式主观评判目标技术的颠覆性潜力。
科技专家在进行颠覆性潜力评价时,先根据自身领域专业知识从清单中遴选出属于颠覆性技术的若干技术,然后再逐个对这些技术按照“技术颠覆性潜力评价三维指标体系”的每个指标进行技术颠覆性潜力评分。课题组在回收技术专家评分结果后,综合“认可技术为颠覆性技术的专家数量”和“专家对技术颠覆性潜力评估分数”两个指标,通过归一化,计算得到每项技术的颠覆性潜力值。每项技术的颠覆性潜力值(Score)的计算公式如下:
(1-2)
(1-3)
其中,m是认可该技术为颠覆性技术的专家数量,max1是所有技术中被认可为颠覆性技术的专家数量*大值。
(1-4)
其中,i是专家序号,n是对该技术评分的专家个数,j是指标序号,k是评分指标个数,Scoreij是第i个专家对该技术第j个指标的评分,max2是所有技术中专家对技术颠覆性潜力评估分数平均值的*大值。
展开