第一章绪论
我国矿产资源禀赋条件差,国内供需矛盾长期存在,对外依存度居高不下,表现出小(人均矿产占有量小)、大(需求量和消费量大)、高(对外依存度和安全风险相对较高)和降(国内资源供应和资源保障能力均有所下降)的特点(翟明国等,2021)。此外,随着我国露头矿和易发现矿越找越少,当前和今后的找矿重点转向覆盖区和深部,研究难点聚焦深层次矿化信息特征提取与集成(左仁广,2021)。深层次矿化信息是指传统方法技术难以识别的矿化信息,包括隐蔽的矿化信息、深部的矿化信息和复杂地质背景下提取的特定信息(陈永清等,2009)。
运用大数据新的研究范式来革新矿产资源潜力评价的传统研究模式,提高找矿成效并破解我国部分矿产资源短缺的困境,是新形势下矿产资源潜力评价面临的重大前沿科学技术难题。地质找矿数据主要包括地质、地球物理、地球化学、遥感、钻探等数据,它们的获取方式多样(包括天上遥测、地面观测、地下探测等)、数据量庞大,且具有多源、异构、高维、高计算复杂度和高不确定性等特点,符合大数据的“4V”[数量大(volume)、更新速度快(velocity)、数据种类多(variety)、数据具有真实性(veracity)]特征(Reichstein et al.,2019),属于典型的时空大数据(Zuo,2020)。基于数据科学进行地质找矿大数据特征提取与信息的集成融合是提高覆盖区和深部找矿成效的关键(左仁广等,2021)。矿产资源潜力智能评价是指基于大数据思维和机器学习(尤其是深度学习)对地质找矿大数据进行深度挖掘与集成融合,圈定找矿远景区并评价其资源潜力。
本章简要介绍矿产资源潜力智能评价的国内外研究现状、基于深度学习的地球化学异常识别的研究现状,以及基于深度学习的矿产资源潜力评价的研究现状。
1.1矿产资源潜力评价概述
矿产资源潜力评价是指在成矿动力学背景和成矿规律研究的基础上,对研究区的地质、地球物理、地球化学、遥感、钻探等数据进行分析,识别和提取成矿-示矿信息,使用数学模型对成矿-示矿信息进行集成融合,在此基础上分析研究区内可能产出的矿种和矿床类型,圈定找矿远景区,并估算未发现矿床数和潜在资源量(陈建平,2021;Zuo,2020;Carranza,2008;赵鹏大,2007,2002;成秋明,2006;王世称等,2000;Cheng et al.,1994;Agterberg,1989;Taylor et al.,1983)。矿产资源潜力评价的主要目的和任务可概括为“有什么类型的矿床产出”“在哪里找”,以及“能找到多少”3个关键科学与技术问题。矿产资源潜力评价已从定性走向了定量,从数据稀疏型走向了数据密集型,急需大数据思维和机器学习支撑(左仁广,2021;Cheng et al.,2020;Zuo,2020;赵鹏大,2019,2015;肖克炎等,2015)。
矿产资源潜力评价*初以定性评价为主,主要使用相似类比法分析预测区内是否有与已发现矿床相似的成矿地质环境,从而判断预测区是否有相同类型的矿床产出(Taylor et al.,1983)。20世纪80年代,随着地理信息系统(geographic information system,GIS)的发展并被成功引入矿产资源潜力评价(Carranza,2008;Pan et al.,2000;Cheng et al.,1999;Bonham-Carter,1994;Agterberg,1992,1989,1970),矿产资源潜力评价逐步走向了定量评价阶段。以加拿大AgterbergF.P.和Bonham-CarterG.教授为首的科研团队改进和发展了基于贝叶斯的证据权模型,并建立了一套完备的基于GIS的矿产资源潜力评价理论体系(Cheng et al.,1999;Bonham-Carter,1994;Agterberg,1992,1989)。这一阶段的特点是GIS技术被应用于矿产资源潜力评价的全过程,包括矿产资源潜力评价数据的收集预处理、证据图层制作、找矿远景区的圈定等。比如我国实施的全国矿产潜力评价项目全过程使用了GIS技术(肖克炎等,2007;叶天竺等,2007)。在这一阶段,很多新方法和模型被引入矿产资源潜力评价中,这些方法可分为知识驱动和数据驱动两大类(Carranza,2008;Bonham-Carter,1994)。数据驱动方法主要是研究已知矿床与周围地质环境及多元找矿信息之间的统计规律,以此确定指示矿床赋存部位地质特征的*佳组合,并借助数学模型开展矿产资源潜力评价。该类方法一般适用于勘查程度相对较高且存在一定数量已知矿床(点)的地区,常用模型包括证据信度模型(Chung et al.,1993;An et al.,1991)、判别分析模型(Chung,1977)、证据权模型(Agterberg,1992)、逻辑回归模型(Carranza et al.,2001;Agterberg,1989)、神经网络模型(Porwal et al.,2003;Singer et al.,1996)、贝叶斯网络模型(Porwal et al.,2006)等。知识驱动方法则要查明矿床形成的基本过程和因素,通过对综合勘查资料和区域成矿规律系统的研究,掌握矿床形成的机制、控矿要素及找矿标志,并结合专家知识将这些要素和过程转化为GIS数字信息,进而圈定成矿远景区。常用的知识驱动模型包括模糊逻辑模型(Nyk.nen,2008;An et al.,1991)、布尔逻辑模型(Harris et al.,2001;Bonham-Carter,1994)、二值化指标叠加模型(Bonham-Carter,1994)、离散化指标叠加模型(Harris,1984)等。当前比较主流的是基于成矿系统的矿产资源潜力评价方法,该方法的首要任务是描述成矿系统,刻画控制矿床形成与保存的关键要素和过程(包括源、运、储、变、保等)(Davies et al.,2020;Ford et al.,2019;Mccuaig et al.,2010;翟裕生,1999;Wyborn et al.,1994)。在此基础上,综合利用多种方法识别和提取这些关键过程或要素,并对其进行集成融合,圈定找矿远景区。
矿产资源潜力评价研究涉及地球系统、成矿系统、勘查系统、评价系统(张振杰等2021;翟裕生,2007)。从矿产资源潜力评价的角度出发,地球系统研究主要探究重大地质事件和深部地质过程对矿床时空分布的制约;成矿系统研究主要探究矿床的成因模型及“源-运-储-变-保”等过程;勘查系统研究主要探究地质-地球物理-地球化学综合找矿模型;评价系统研究基于现有的数据识别和提取找矿模型中的找矿指标,建立预测模型,并开展矿产资源潜力评价。当前,上述4个系统之间的交叉融合还需要进一步加强,尤其是成矿系统与勘查系统(矿床学与矿产勘查学的交叉融合,可更好地服务于把成矿模型转化成找矿模型)及勘查系统与评价系统(矿产勘查与数学地球科学深度交叉融合,可更好地服务于把地质找矿数据转化成找矿指标)的交叉融合。矿床是具有*大经济价值的异常,找矿*重要的是识别和提取成矿-示矿信息,然后根据矿床形成的地质环境及矿床的保存变化情况判断提取的成矿-示矿信息是否属于矿致异常,进而圈定找矿远景区并评价矿产资源潜力。矿产资源潜力评价的一般流程如图1.1所示。
1.2矿产资源潜力智能评价方法概述
深度学习是具有多层隐含层的神经网络模型,通过学习和提取数据更深层次的抽象特征,进而达到提升分类或预测准确性的目的(LeCun et al.,2015;Hinton et al.,2006a),是目前进行大数据处理与分析的*佳方法之一。21世纪以来,随着地质信息化程度的提高,人们已经积累了大量的地质、地球物理、地球化学、遥感和钻探数据,地质科学进入了地质大数据时代。深度学习通过从低级到高级(隐蔽信息)逐层提取矿致异常,可识别和提取常规方法难以发现的矿致异常。同时深度学习可对多种控矿要素间复杂的时空耦合关系进行无限逼近和拟合,提高多源找矿信息融合成效。因此,矿产资源潜力评价亟须与深度学习相结合,发展基于深度学习的矿产资源潜力智能评价理论与方法。
在著名的《韦氏词典》中,智能(intelligence)有三种解释:“having or indicating a high or satisfactory degree of intelligence and mental capacity,or revealing or reflecting good judgment or sound thought(具有令人满意的智力和心智能力,或显示或反映良好的判断力或健全的思想)”;“possessing intelligence,or guided or directed by intellect(拥有智慧,或由智慧引导或指导)”;“guided or controlled by a computer,or able to produce printed material from digital signals(由计算机引导或控制的,或能从数字信号中产生印刷品的)”。据此,矿产资源潜力智能评价可定义为:利用人工智能算法对包括地质文本在内的地质找矿时空大数据进行深度挖掘,构建矿产资源潜力评价领域知识图谱,以知识图谱中所包含的专家知识为驱动,对地质找矿时空大数据进行集成融合,进而圈定找矿远景区并评价其资源潜力。矿产资源潜力智能评价包括智能认知(对矿床成因和找矿模型的抽取与表达)、智能学习(关键控矿要素识别与提取)和智能决策(找矿信息挖掘与集成)(图1.2)。即利用知识图谱和人工智能算法挖掘包含文本数据在内的地质找矿大数据,构建矿产资源潜力评价领域知识图谱,实现成矿规律的智能认知;利用GIS和人工智能算法分析和挖掘地质找矿时空大数据与矿床的空间相关性,识别和提取知识图谱中关键找矿信息,实现找矿信息的智能学习;利用人工智能算法对多源找矿信息深度集成融合,圈定找矿远景区和评价矿产资源潜力,实现找矿评价的智能决策。
矿产资源潜力智能评价强调知识图谱、地理信息系统和深度学习算法的相互融合。矿产资源潜力评价是在成矿动力学背景和成矿规律研究的基础上开展的,如何构建包含矿床形成与保存及找矿模型知识的矿产资源潜力评价领域知识图谱就显得格外重要。矿产资源潜力评价关键在于空间位置评价,因此,地理信息系统提供的强大的空间分析功能,可有效地分析地质找矿大数据与矿床时空分布规律的相关性。
1.2.1智能认知
智能认知是指基于知识图谱等人工智能算法,对地质大数据进行分析,实现计算机自动学习和抽取矿床成矿模型或找矿勘查模型的关键知识和要素。知识图谱是一种用于积累和传递真实世界知识的数据图,其节点表示感兴趣的实体,其边表示实体之间的语义关系(Hogan et al.,2020)。知识图谱本质上为领域知识库,它利用三元组的强语义关系组织管理知识。从知识管理的角度,知识图谱可以看作语义升级版的专家系统(Wang et al.,2021)。知识图谱中蕴含的专家知识和认知可以驱动矿产资源潜力评价的智能化和自动化。
智能认知主要以知识图谱为核心,利用自然语言处理、深度学习和数据映射等方法对地质大数据进行深度挖掘,构建矿产资源潜力评价领域的“智脑”。考虑知识图谱的适用性和方便性,矿产资源潜力评价领域知识图谱可以从两个方面构建知识概念模型:①从“源”(成矿物质来源、流体来源和热源)、“运”(成矿物质运移通道)、“储”(成矿物质沉淀场所)、“变”(矿床形成后的变化)和“保”(矿床的保存)5个层面构建矿床形成和变化保存的成矿模型的知识图谱;②从矿床形成的地质环境(包括大地构造背景、成矿环境、成矿时代等)、矿床特征(包括矿体空间分布、矿物组合、矿石结构、构造、围岩蚀变等)、地球化学特征(包括单元素异常和地球化学组合异常)、地球物
展开