本发明涉及计算机,尤其涉及一种基于知识图谱的关联检索方法、装置、设备及介质。
背景技术:
1、知识图谱是在信息检索、自然语言处理和人工智能等领域中崭露头角的一项技术。通过将实体及其关系以图的形式表示,构建了一种结构化的知识表示方法。这种方法有助于更好地理解和利用信息。
2、知识图谱在内容检索领域的应用取得了显著的成果。通过将信息以图的形式组织,可以进行关联性检索。
3、现有技术中的关联检索方式不能结合领域知识,使得其在实际应用中,关联检索的结果关联性弱且准确度较低。
技术实现思路
1、针对现有技术存在的问题,本发明提供一种基于知识图谱的关联检索方法、装置、设备及介质。
2、本发明提供一种基于知识图谱的关联检索方法,包括:
3、获取待检索文本;
4、基于融合了自定义词典的分词工具对所述待检索文本进行分词,得到所述待检索文本对应的包括至少一个实体词的切分词组;所述自定义词典是基于领域知识图谱确定的;
5、确定所述切分词组中的各所述实体词分别对应的实体标签;
6、基于各所述实体词和各所述实体标签,在所述领域知识图谱中确定所述待检索文本对应的关联检索结果。
7、根据本发明提供的一种基于知识图谱的关联检索方法,所述基于融合了自定义词典的分词工具对所述待检索文本进行分词,得到所述待检索文本对应的包括至少一个实体词的切分词组,包括:
8、基于所述分词工具对所述待检索文本进行清洗,去除所述待检索文本的特殊字符;
9、基于所述分词工具对清洗过后的所述待检索文本进行切分,得到至少一个切分组合;
10、基于所述自定义词典对基于各所述切分组合构建的有向无环图进行扫描,得到至少一条分词路径;
11、基于动态规划算法确定各所述分词路径中的最大概率路径,得到所述最大概率路径对应的所述切分词组。
12、根据本发明提供的一种基于知识图谱的关联检索方法,所述确定所述切分词组中的各所述实体词分别对应的实体标签之前,所述方法还包括:
13、基于所述领域知识图谱,构建多义词词典;所述多义词词典中的实体词对应至少两个实体标签。
14、根据本发明提供的一种基于知识图谱的关联检索方法,所述方法还包括:
15、将所述切分词组中的各所述实体词与所述多义词词典进行匹配;
16、在所述多义词词典中匹配到所述且分词组中的各所述实体词的情况下,确定所述切分词组中的各所述实体词分别对应的实体标签。
17、根据本发明提供的一种基于知识图谱的关联检索方法,所述基于各所述实体词和各所述实体标签,在所述领域知识图谱中确定所述待检索文本对应的关联检索结果之前,所述方法还包括:
18、定义检索语句和检索数组;所述检索语句中包括检索深度、返回数据数量、节点筛选条件、排除关系类型、排除节点标签中的至少一项;所述检索数组包括所述待检索文本对应的各所述实体词及各所述实体词分别对应的所述实体标签。
19、根据本发明提供的一种基于知识图谱的关联检索方法,所述自定义词典与所述领域知识图谱同步更新。
20、本发明还提供一种基于知识图谱的关联检索装置,包括:
21、获取模块,用于获取待检索文本;
22、分词模块,用于基于融合了自定义词典的分词工具对所述待检索文本进行分词,得到所述待检索文本对应的包括至少一个实体词的切分词组;所述自定义词典是基于领域知识图谱确定的;
23、确定模块,用于确定所述切分词组中的各所述实体词分别对应的实体标签;
24、检索模块,用于基于各所述实体词和各所述实体标签,在所述领域知识图谱中确定所述待检索文本对应的关联检索结果。
25、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的基于知识图谱的关联检索方法。
26、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的基于知识图谱的关联检索方法。
27、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的基于知识图谱的关联检索方法。
28、本发明提供的一种基于知识图谱的关联检索方法、装置、设备及介质,通过对获取的待检索文本,基于融合了自定义词典的分词工具对获取的待检索文本进行分词,得到待检索文本对应的切分词组,切分词组中包括了多个实体词,然后确定切分词组中各个实体词对应的实体标签,最后在领域知识图谱中确定切分词组中的实体词对应的关联检索结果。本发明的基于知识图谱的关联检索方法通过融合了领域知识图谱对应的自定义词典的分词器,对待检索文本进行分词,可以充分利用领域知识图谱中的数据,挖掘待检索文本中蕴藏的关键信息,提升关联检索的关联性和准确度。
1.一种基于知识图谱的关联检索方法,其特征在于,包括:
2.根据权利要求1所述的基于知识图谱的关联检索方法,其特征在于,所述基于融合了自定义词典的分词工具对所述待检索文本进行分词,得到所述待检索文本对应的包括至少一个实体词的切分词组,包括:
3.根据权利要求1所述的基于知识图谱的关联检索方法,其特征在于,所述确定所述切分词组中的各所述实体词分别对应的实体标签之前,所述方法还包括:
4.根据权利要求3所述的基于知识图谱的关联检索方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的基于知识图谱的关联检索方法,其特征在于,所述基于各所述实体词和各所述实体标签,在所述领域知识图谱中确定所述待检索文本对应的关联检索结果之前,所述方法还包括:
6.根据权利要求1所述的基于知识图谱的关联检索方法,其特征在于,所述自定义词典与所述领域知识图谱同步更新。
7.一种基于知识图谱的关联检索装置,其特征在于,包括:
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的基于知识图谱的关联检索方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的基于知识图谱的关联检索方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的基于知识图谱的关联检索方法。