同城炮约软件-100块钱3小时上门二维码,全国资源群茶,初中生200块钱可以约

科研动态

新疆生地所提出地质知识约束的实体关系抽取方法

时间:2025-04-11

????近年来,开放数据倡议推动了大量地球科学数据的发布与共享,极大促进了地球科学领域的数据互通与应用创新。借助自然语言处理与深度学习技术,从地球科学文本中自动提取知识,逐渐成为智能地学研究的重要方向。作为地球科学文本数据的重要组成,地质文本蕴含了丰富的地质环境与矿床信息。从这类非结构化文本中自动提取结构化地质知识,对于构建地质知识图谱、实现知识发现与找矿预测具有重要意义。

????已有大量研究从不同角度探讨了地质实体及其关系的抽取方法,并在一定程度上利用了地质本体或地质模式来指导数据集构建。然而,当前研究普遍缺乏对“如何将地质知识系统性地引入信息抽取模型,以提升抽取准确性与鲁棒性”的深入探索,制约了地质文本信息抽取的自动化与智能化发展。

????针对这一问题,中国科学院新疆生态与地理研究所新疆矿产资源研究中心科研团队提出了一种地质知识约束的实体关系抽取方法(Geological Knowledge-constrained Entity and Relation Extraction, GKERE)。该方法以RoBERTa预训练语言模型为基础对地质文本进行语义编码,并融合由地质专家构建的地质模式增强信息抽取过程。具体而言,GKERE首先采用基于跨度的命名实体识别模型获取实体信息,随后结合地质模式生成候选实体对并预测其关系。地质模式不仅用于过滤冗余实体对,还为关系预测提供实体类型与关系约束信息,从而提升抽取的精确性与效率。为了验证方法的有效性,研究以花岗伟晶岩型锂矿床为案例开展实验。结果表明,GKERE方法在地质实体关系提取任务中取得了显著提升,验证了地质知识对模型性能的积极贡献。

????地质知识的引入在提升模型计算效率的同时,有效增强了信息抽取结果的准确性与可信度。GKERE方法不仅为地质文本中的实体-关系三元组自动化抽取提供了新方法,也显著优化了地质知识图谱构建与地质知识发现的整体流程。

????以上研究成果以“A geological knowledge-constrained entity and relation extraction method for text: A case study of granitic pegmatite-type lithium deposits”为题发表在《Computers & Geosciences》。中国科学院新疆生态与地理研究所博士研究生陶金涛为论文第一作者,张楠楠研究员为通讯作者。该研究得到新疆维吾尔自治区重大科技专项、重点研发任务专项和天山英才计划的支持。

????文章链接:https://doi.org/10.1016/j.cageo.2025.105920

图1:整体流程图

图2:GKERE模型结构图

图3:部分抽取结果构成的知识图谱

附件下载: