本书首先使用CWE与CVE漏洞数据库中的数据构建了软件漏洞文本数据集,为漏洞知识抽取提供了有效数据;其次,提出了结合N元语言模型与掩码文本的漏洞知识抽取方法,用于进行知识抽取;再次,通过对漏洞知识的研究分析,找到漏洞之间的关系,并构建软件漏洞知识图谱;最后,通过对比实验,使用不同的方法及参数设置来验证本研究的方法对漏洞知识抽取的有效性和参数设置的合理性。
为了更好地研究漏洞,解决当前软件安全漏洞数据利用率低、漏洞语义信息不够丰富等问题,我们提出了一种基于软件安全漏洞领域知识图谱构建的设计方案。针对漏洞知识图谱的构建提出三层架构模型,并将构建过程规范总结为数据获取、领域短语抽取、本体构建、信息抽取、数据存储、可视化及检索等六个步骤,每个步骤进行了详细设计。基于三层架构模型实现了自动化构建软件安全漏洞领域知识图谱,并将碎片化、价值密度低的网络安全漏洞信息以结构化三元组形式存储在Neo4j图形数据库,构建知识图谱。通过构建的漏洞知识图谱实现了漏洞信息关联查询和可视化推理分析等功能,有助于实现软件安全漏洞数据分析更加智能化的目标。
展开