1.2.2数据检索
本课题采用的专利文献数据主要来自国家知识产权局专利检索与服务系统和CPRS系统。
专利文献来源包括:
CPRSABS(中国专利文献数据库),数据涵盖自1985年至今所有中国专利文献数据;
CNTXT(中国专利全文文本代码化数据库),数据涵盖1985年至今的中国专利全文文本代码化数据,可针对全文数据的信息进行检索;
DWPI(德温特世界专利索引数据库),包括八国两组织在内的47个国家和组织从1948年至今的专利数据,德温特专利数据还将其收录的专利按照一定的规则整理出具有德温特数据特色的同族数据。数据具有准确、有序的特性。
本课题针对中国专利数据库和全球专利数据库检索的截止日期为2012年4月30日。由于发明专利申请自申请日(有优先权的自优先权日)起18个月(主动要求提前公开的除外)才能被公布,实用新型专利申请在授权后才能获得公布(即其公布日的滞后程度取决于审查周期的长短),而PCT专利申请可能自申请日起30个月甚至更长时间之后才进入到国家阶段(导致其相对应的国家公布时间更晚),并且在专利申请公布后再经过编辑而进人数据库也需要一定的时间,因此在实际数据中会出现2010年之后的专利申请量比实际申请量少的情况,反映到本报告中的各技术申请量年度变化的趋势图中,一般自2010年之后出现较为明显的下降。
功率半导体器件涉及的技术领域相关国际专利分类号较多,关键词虽然相对准确但遗漏文献的可能性较大。鉴于以上情况,采取的检索思路是:将各类相关的半导体功率半导体器件进行分块检索,同时,对相对较为准确的涉及功率半导体器件的分类号进行检索,并将所得到的结果相互比较运算,以观察该检索策略的有效性。
按照技术分解表将半导体功率半导体器件分成:IGBT;功率二极管;MOSFET(DMOS、超结MOS、SIT静电感应晶体管、HEMT高电子迁移率晶体管);双极型晶体管;晶闸管(GTO、BGT、温控晶闸管、光控晶闸管)等部分。按照上述器件类型的分解,对每一部分进行检索,最后将每部分的结果进行合并,从而得到最终全部数据。
在每个部分的检索中,为了避免由于过多使用关键词而导致的漏检或引入噪声,主要采用分类号进行限定,关键词的选择则按照较为上位的词的原则。先用分类号限定出总的范围,再用关键词进行限定得到相对准确的范围。在检索的前期,首先选用最准确的关键词和分类号得出比较准确的检索结果,对其进行阅读浏览,发现一些关键词和分类号,然后进行扩展,得出比较全的结果,在进行浏览之后去除明显的噪声,随着理解的深入,进一步扩展,力求取得全面的结果。随后对噪声源进行分析,采用分类号或者关键词等手段进行去噪,特别的中文专利文献采用人工去噪。
……
展开