本发明涉及司法取证,具体涉及一种基于已获取证据和现场信息的取证指引方法和装置。
背景技术:
1、侦查阶段中罪名的预判对于案件主要证据的获取、辅助办案人员获取案件中的证据具有重要意义,目前的罪名预测技术多通过案件判决书中的事实描述并采用端到端的黑盒模型实现罪名的预测,没有充分利用案件已有的证据,不符合取证阶段实际,且结果缺乏可解释性。
2、在司法实践中,案件证据很重要,法院对案件的判决需要证据支持,所以公安机关在侦查案件时要收集与案件相关的证据,证据会直接影响到法院判决的结果。针对取证指引,现有系统多以相关规定为指引,并结合以往办理案件的实践经验进行人工取证。在现有的司法办案流程中,公安机关大都以相关规定为指引,并结合以往办理案件的实践经验进行人工取证,通过一些影像记录设备进行辅助记录,方法存在刻板、不灵活等缺陷。此外,由于传统取证方法依赖人工方式,无法有效将已有证据、现场信息与取证方向联合起来,存在实时信息沟通壁垒。
3、针对罪名预测,现有技术多通过案件判决书中的事实描述,采用端到端的黑盒模型实现罪名的预测。贵州大学提出一种融合行为词的罪名预测多任务学习方法及其系统(cn116050609a),通过对裁判文书的案件描述中行为词的抽取和相关性信息预测罪名;思创数码科技股份有限公司提出一种罪名预测方法、系统、可读存储介质及计算机设备(cn116308898a),通过提取案件描述文本,根据案件描述文本得到犯罪事实词序列,并生成犯罪事实的特征矩阵,用多个卷积核对犯罪事实的特征矩阵进行局部特征提取,对得到的局部特征进行卷积操作,以得到局部特征的特征图,根据特征图进行计算得到局部最优特征,局部最优特征输入分类器,在分类器中完成罪名预测。
4、现有的罪名预测技术多通过案件判决书中的事实描述并采用端到端的黑盒模型实现罪名的预测,没有充分利用案件已有的证据,未基于现场已获取证据进行预测,存在不符合取证阶段实际的问题。目前的取证方法多依赖于相关规定和办案人员的经验,没有很好的利用已有证据和现场信息,存在现有线索无法为后续取证方向提供指引的问题,此外现有办案流程多依赖人工手动操作和录入,未将智能化办案融入日常办案中,效率低下且有效信息存在沟通单壁垒。
技术实现思路
1、有鉴于此,本发明提供了一种基于已获取证据和现场信息的取证指引方法和装置,能够解决如何高效、准确取证等关键技术问题。
2、为了解决上述技术问题,本发明是这样实现的。
3、一种基于已获取证据和现场信息的取证指引方法,所述方法包括:
4、步骤s1:基于案件的已获取证据,提取案件要素,所述案件要素包括案件的时间、地点、物品、人物信息,基于所述案件要素,确定当前案件已有线索;
5、步骤s2:获取所述案件的证据要素,所述证据要素是指笔录中的信息;基于所述证据要素,建立所述证据要素与证据证实的事实的关联对,将所述关联对输入训练完毕的神经网络模型,对所述案件涉嫌的罪名进行预测;
6、步骤s3:获取案件的现场信息,为所述现场信息添加信息标签,所述信息标签用于表征需要针对性进行取证的案件必要信息,所述信息标签的添加方式为依据已获取的证据、现场情况进行选取;
7、步骤s4:基于专家经验和历史案件证据的取证内容,提取每个信息标签下的取证数据,梳理取证指引规则;基于信息标签从历史案件数据库中获取同类历史案件,基于所述同类历史案件,生成取证内容建议;基于所述当前案件已有线索、预测的罪名、取证指引规则及取证内容建议,生成取证指引信息。
8、优选地,所述步骤s2,包括:
9、步骤s21:对已有证据以及受案登记表中的信息进行筛选,获取有效证据数据以及有效登记信息,对所述有效证据数据进行分片数据抽取,清除其中的脏数据,获取证据要素;对所述有效登记信息进行文本抽取,获取证据证实的事实;使用apriori算法,建立所述证据要素与证据证实的事实的词级关联对;
10、步骤s22:对所述词级关联对建立词级别的注意力机制,形成词级编码特征向量,得到输入特征向量;
11、所述词级别的注意力机制的计算公式为:
12、
13、
14、其中,n为词级关联对数量,w∈rd×d,是权重矩阵,hi∈rd×1,表示词i的词向量,om表示注意力机制的输出向量;
15、步骤s23:将所述输入特征向量输入训练完毕的神经网络模型,所述神经网络模型为罪名预测模型,用于预测所述案件涉嫌的罪名。
16、优选地,所述罪名预测模型包括依次相连的embedding层、编码层和分类层;所述输入特征向量输入embedding层,进行词向量处理,得到特定维度的词向量,并输入编码层,得到位置编码;将位置编码输入分类层,得到所述案件涉嫌的罪名。
17、优选地,所述罪名预测模型采用交叉熵损失函数作为目标函数,利用softmax计算不同罪名的概率。
18、优选地,在所述案件涉嫌的罪名预测结果不准确的情况下,通过人工调整的方式,对所述案件涉嫌的罪名进行调整。
19、本发明所提供的一种基于已获取证据和现场信息的取证指引装置,所述装置包括:
20、线索确定模块:配置为基于案件的已获取证据,提取案件要素,所述案件要素包括案件的时间、地点、物品、人物信息,基于所述案件要素,确定当前案件已有线索;
21、罪名预测模块:配置为获取所述案件的证据要素,所述证据要素是指笔录中的信息;基于所述证据要素,建立所述证据要素与证据证实的事实的关联对,将所述关联对输入训练完毕的神经网络模型,对所述案件涉嫌的罪名进行预测;
22、标签模块:配置为获取案件的现场信息,为所述现场信息添加信息标签,所述信息标签用于表征需要针对性进行取证的案件必要信息,所述信息标签的添加方式为依据已获取的证据、现场情况进行选取;
23、取证指引模块:配置为基于专家经验和历史案件证据的取证内容,提取每个信息标签下的取证数据,梳理取证指引规则;基于信息标签从历史案件数据库中获取同类历史案件,基于所述同类历史案件,生成取证内容建议;基于所述当前案件已有线索、预测的罪名、取证指引规则及取证内容建议,生成取证指引信息。
24、本发明所提供的一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述方法。
25、本发明所提供的一种电子设备,其特征在于,所述电子设备,包括:
26、处理器,用于执行多条指令;
27、存储器,用于存储多条指令;
28、其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如前所述方法。
29、本发明基于机器学习、自然语言处理等技术,开展基于已获取证据的罪名预测技术研究、基于现场描述和已获取证据的取证指引技术研究。本发明的技术实现分为两个部分,首先基于已有证据信息和历史案件知识模型推理实现侦查取证过程中罪名的智能预测,辅助侦查人员判别罪名。其次在罪名预测的基础上,提供基于罪名预测的取证指引服务,支撑交互式案件现场智能理解,实现取证方向以及取证目标的规划功能和面向现场的交互式取证指引服务。
30、本发明所带来的有益技术效果:
31、(1)本发明提出已获取证据的罪名预测技术,结合专家知识和机器学习方法,利用已获取证据实现案件要素关键词的智能提取,将证据要素与事实联合分析实现罪名预测,与现有技术罪名预测技术单纯依据案件事实,没有充分利用已获取证据相比较,本发明预测结果较为全面,预测结果更加准确。
32、(2)本发明基于关键词的罪名预测模型,利用词向量技术、神经网络语言模型、多任务学习模型和bi-lstm实现基于案情要素的罪名预测,在原有罪名预测的能力基础上提高了罪名预测的准确率和罪名类型。
33、(3)本发明基于专家知识和经验对现场信息进行梳理,采用了全新的视角,利用标签形式对现场信息进行描述,设计了交互式的现场信息描述输入方式,并实现了结合专家经验和历史案件证据的取证内容指引算法,实现了基于历史案件证据取证指引的从无到有;实现已获取证据中案件线索的提取和推荐,突破了面向侦查取证的案件要素识别技术,实现了基于历史案件数据的案件线索指引。
1.一种基于已获取证据和现场信息的取证指引方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述步骤s2,包括:
3.如权利要求2所述的方法,其特征在于,所述罪名预测模型包括依次相连的embedding层、编码层和分类层;所述输入特征向量输入embedding层,进行词向量处理,得到特定维度的词向量,并输入编码层,得到位置编码;将位置编码输入分类层,得到所述案件涉嫌的罪名。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述罪名预测模型采用交叉熵损失函数作为目标函数,利用softmax计算不同罪名的概率。
5.如权利要求1-3中任一项所述的方法,其特征在于,在所述案件涉嫌的罪名预测结果不准确的情况下,通过人工调整的方式,对所述案件涉嫌的罪名进行调整。
6.一种基于已获取证据和现场信息的取证指引装置,其特征在于,所述装置包括:
7.一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-5中任一项所述方法。
8.一种电子设备,其特征在于,所述电子设备,包括: