一种适用于遥感解译成果融合知识图谱的智能问答方法与流程

    专利2025-02-25  35


    本发明涉及知识图谱智能问答,具体涉及一种适用于遥感解译成果融合知识图谱的智能问答方法。


    背景技术:

    1、为解决遥感图像解译成果逐渐增多,格式较为分散,难以形成联动查询的问题,需要融合遥感解译成果并构建知识图谱来实现多源信息之间的关联和聚合。通过建立规范的图数据库结构,挖掘各种复杂解译成果之间的关联,使得以长文本、json和关系数据库等形式存在的成果可以融合到同一个知识图谱中进行展示,发挥知识图谱对源数据包容性强的优势,辅助决策者进行联合查看和分析。

    2、在遥感解译成果融合知识图谱建设完成之后,如何能从知识图谱中获取想要的知识才是建设知识图谱的终极目标。然而用户获取知识具有一定的困难,一方面,常规的检索查询具有较高的用户门槛,用户往往需要先具备使用图数据查询语言,例如neo4j对应的cypher语言等的能力,才能从知识图谱中搜索出想要的结果。另一方面,查询结果的返回格式以json语言存在,解析之前难以直接获取最有效的信息。因此,需要知识图谱智能问答技术来解决这两个痛点。智能问答技术既可以接受用户进行自然语言提问,解决了查询语言门槛的问题。同时可以生成自然语言返回给用户,从而能够快速给出重要信息。实现用户友好的自然语言问答并快速获取关键知识,发挥遥感解译成果融合知识图谱的价值。

    3、然而,现有的智能问答相关技术往往解决的是通用知识图谱的问答,针对专业领域的知识图谱问答研究较少。同时由于信息的敏感性和局限性,遥感解译成果融合知识图谱的智能问答不具备实时联网的条件,算法需要在离线环境下进行。因此需要一种能针对遥感解译信息专业领域且能支持在离线环境下运行和处理的知识图谱智能问答方法,以满足自然语言实时问答的需求。


    技术实现思路

    1、本发明为了解决现有的智能问答相关技术解决的是通用知识图谱的问答,针对专业领域的知识图谱问答研究较少以及感解译成果融合知识图谱的智能问答不具备实时联网的条件,算法需要在离线环境下进行的问题,提供一种适用于遥感问答成果融合知识图谱的智能问答方法,所述方法包括如下步骤:

    2、s1、获取用户提问语句,设置默认回答记为ad,加载自然语言处理模型jieba库;

    3、s2、构建用户自定义词典,分别建立实体、关系和属性词典;

    4、s3、用jieba库的load_userdict方法加载所述实体、关系和属性自定义词典;

    5、s4、根据用户的提问语句,用jieba库posseg模块的lcut方法实现基于用户自定义词典的分词;

    6、s5、根据分词结果,对用户提问进行问题分类;

    7、s6、根据问题分类结果,将步骤s5中的记录的信息进行组装,并转化为cypher语句;

    8、s7、将所述cypher语句放到neo4j图数据库,即遥感问答成果融合知识图谱中查询,获取json形式的返回值;

    9、s8、将返回值保存,并从中抽取关键信息,所述关键信息包括实体词语名称、关系词语名称以及属性词语名称;

    10、s9、根据问题分类结果确定答案模板,并将步骤s8中所述关键信息进行组装,生成最终答案,返回给用户,问答结束。

    11、进一步,所述步骤s2具体为:

    12、s21:将遥感问答成果融合知识图谱中的实体按类别放进实体自定义词典中,将实体名称作为自定义实体词典的实体词语名称,实体类型作为对应的实体词性标签,词频数为默认值,假设共有m类不同的实体词性标签,记为{e1,e2,...,em};

    13、s22、将知识图谱中的关系按类别放进关系自定义词典中,将关系名称作为关系词典的关系词语名称,关系类别作为对应的关系词性标签,词频数为默认值,假设共有l类不同的关系词性标签,记为{r1,r2,...,rl};

    14、s23、将知识图谱中涉及问答的关键属性值按类别放进属性自定义词典中,将属性名称作为属性词典的属性词语名称,属性类别作为对应的属性词性标签,词频数为默认值,假设共有v类不同的属性词性标签,记为{p1,p2,...,pv}。

    15、进一步,所述步骤s4中,假设共计有n个分词,将分词结果记为sq={q1,q2,...,qn},其中每个qi由对应的词语名称si以及词性标签ti,组成,从而有:

    16、qi=(si,ti),sq={(s1,t1),(s2,t2),…,(sn,tn)}。

    17、进一步,所述步骤s5具体为:

    18、s51、遍历分词结果的词性标签t1到tn,与实体词性标签e1到em进行比较,直到有tentityn=ej(entityn∈(1,n),j∈(1,m));若遍历结束仍未匹配成功,则问答结束,返回默认回答ad;否则记录此词性标签tentityn及其对应的词语名称sentityn;

    19、s52、遍历分词结果的词性标签t1到tn,与关系词性标签r1到rl进行比较,直到有若遍历结束仍未匹配成功,则转到步骤s54,否则转到步骤s53;

    20、s53、遍历分词结果中的词语名称s1到sn,与实体词性标签e1到em进行比较,直到有若遍历结束仍未匹配成功,则问答结束,返回默认回答ad;否则记录sentityn、tentityn、trelationshipn以及setypen,然后转到步骤s61;

    21、s54、遍历分词结果词性标签t1到tn,与属性词性标签p1到pl进行比较,直到有若遍历结束仍未匹配成功,则问答结束,返回默认回答ad;否则记录sentityn以及tentityn,然后转到步骤s62。

    22、进一步,所述步骤s6具体为:

    23、s61、将步骤s53中提记录的信息进行组装,并转化为cypher语句:

    24、cypherquery=″match(m:tentityn)-[r:trelationshipn]->(n:tetypen)where m.name=

    25、sentityn return m.name,r.name,n.name″;

    26、其中tentityn,trelationshipn,tetypen,setypen需要替换为具体的值;m.name、r.name以及n.name分别表示实体名称、关系名称以及目标实体名称;

    27、s62、将步骤s54中提记录的信息进行组装,并转化为cypher语句:

    28、cypherquery

    29、=″match(m:tentityn)where m.name sentityn return m.profile″

    30、其中tentityn,sentityn需要替换为具体的值;m.profile表示目标属性值。

    31、本发明所述方法的有益效果为:

    32、本发明所述方法能够解决现有问答算法只适用于通用问答,而对遥感解译信息专业领域问答不准确的问题。本发明所述方法首先针对遥感解译信息专业用户的提问进行问题解析,用自然语言处理的分词算法对用户提问进行分类,同时抽取提问中的关键实体。之后用基于规则的方法自动化生成cypher图数据库查询语言,将查询返回的json结果进行自动解析,并将关键信息组装成自然语言返回给用户。同时本发明能够满足离线环境下运行的要求,采用预设词典和本地查询等方法实现全流程离线解析,提高遥感解译成果融合知识图谱自然语言问答的环境适应性与准确度。


    技术特征:

    1.一种适用于遥感问答成果融合知识图谱的智能问答方法,其特征在于,所述方法包括如下步骤:

    2.根据权利要求1所述的适用于遥感问答成果融合知识图谱的智能问答方法,其特征在于,所述步骤s2具体为:

    3.根据权利要求2所述的适用于遥感问答成果融合知识图谱的智能问答方法,其特征在于,所述步骤s4中,假设共计有n个分词,将分词结果记为sq={q1,q2,...,qn},其中每个qi由对应的词语名称si以及词性标签ti,组成,从而有:

    4.根据权利要求3所述的适用于遥感问答成果融合知识图谱的智能问答方法,其特征在于,所述步骤s5具体为:

    5.根据权利要求4所述的适用于遥感问答成果融合知识图谱的智能问答方法,其特征在于,所述步骤s6具体为:


    技术总结
    一种适用于遥感解译成果融合知识图谱的智能问答方法。涉及知识图谱智能问答技术领域,具体涉及一种适用于遥感解译成果融合知识图谱的智能问答方法。所述方法首先针对遥感解译信息专业用户的提问进行问题解析,用自然语言处理的分词算法对用户提问进行分类,同时抽取提问中的关键实体。之后用基于规则的方法自动化生成Cypher图数据库查询语言,将查询返回的JSON结果进行自动解析,并将关键信息组装成自然语言返回给用户。同时本发明能够满足离线环境下运行的要求,采用预设词典和本地查询等方法实现全流程离线解析,提高遥感解译成果融合知识图谱自然语言问答的环境适应性与准确度。

    技术研发人员:赵园薇,张鹏,安源,高放,孙力壮,王晓东,隋天凤
    受保护的技术使用者:长光卫星技术股份有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-83390.html

    最新回复(0)