一种基于人工智能的病案信息管理方法与流程

专利2026-03-02 20

本发明涉及数据处理，具体是指一种基于人工智能的病案信息管理方法。

背景技术：

1、病案信息管理方法是指对医疗机构中产生的病案信息进行收集、整理、存储、分析和利用的一系列管理措施和方法，常利用聚类算法对病案信息进行分组和分类。但是一般信息整理方法存在聚类时昂贵的计算导致资源和时间的浪费，异常值对聚类结果的影响过大从而导致聚类效果差的问题；一般信息整理方法存在聚类时参数选取不当导致聚类结果不精准，搜索方法收敛性差的问题。

技术实现思路

1、针对上述情况，为克服现有技术的缺陷，本发明提供了一种基于人工智能的病案信息管理方法，针对一般信息整理方法存在聚类时昂贵的计算导致资源和时间的浪费，异常值对聚类结果的影响过大从而导致聚类效果差的问题，本方案通过计算经济的下界避免不必要的欧氏距离的计算，减少计算复杂度；基于快向量、段均值和非线性嵌入的下界计算方式更全面考虑数据特征，增强聚类的鲁棒性；权衡多种下界更好地适应数据分布；针对一般信息整理方法存在聚类时参数选取不当导致聚类结果不精准，搜索方法收敛性差的问题，本方案基于三次映射初始化粒子群，设计自适应缩减移动参数激励粒子密集搜索，加速收敛，提高搜索效率；权衡局部搜索和全局搜索设计移动策略，提高搜索准确性。

2、本发明采取的技术方案如下：本发明提供的一种基于人工智能的病案信息管理方法，该方法包括以下步骤：

3、步骤s1：数据采集；

4、步骤s2：数据预处理；

5、步骤s3：定义经济的下界；

6、步骤s4：参数搜索；

7、步骤s5：聚类。

8、进一步地，在步骤s1中，所述数据采集是采集用户基本信息、病史信息、患者症状、治疗方案和医疗机构信息。

9、进一步地，在步骤s2中，所述数据预处理是对采集的数据进行数据清洗、数据转换和数据标准化处理；所述数据清洗包括缺失值处理和异常值处理；所述数据转换是对数据类型进行独热编码处理作为特征的维度，将文本数据转换为向量；所述数据标准化处理是利用z-score标准化对每一个维度的数据进行归一化处理。

10、进一步地，在步骤s3中，所述定义经济的下界具体包括以下步骤：

11、步骤s31：预定义，给定数据点x，bsf表示x与最近聚类中心之间的欧几里德距离；设c是下一个需要检查的聚类中心；在计算欧几里德距离ed(x,c)之前，首先计算经济的下界lb(x,c)；若lb(x,c)>bsf，则有；因此，c不能是x的聚类中心，而无需计算昂贵的ed(x,c)；

12、步骤s32：定义基于块向量的下界，包括：

13、步骤s321：给定一个数据点，其中x1、x2和xd是数据点每个维度的值；将其平均分成b个块；每个块的大小为s，即每个块维度大小为s；若d不能被s整除，进行填充操作；得到第i个块；其中，(i-1)×s+1是块的起始维度索引，i×s是块的结束维度索引；数据点x被重写为；

14、步骤s322：数据点规范化，规范后数据点x的块向量bv表示为，其中、和都是规范化后的数据点，规范化所用公式如下：

15、；

16、式中，是规范化后的第i个数据点；j是维度索引；

17、步骤s323：计算基于块向量的下界，所用公式如下：

18、；

19、式中，lbbv(x,y)是基于块向量bv(x)和块向量(y)的下界；ed(·)是欧几里得距离；

20、步骤s33：定义基于段均值的下界，包括：

21、步骤s331：数据点段均值化，得到数据点x的段均值的表示为，其中、和都是段均值后的数据，段的数量b和块的数量相同；段均值化所用公式如下：

22、；

23、式中，是第i段数据的均值；s1是每个段的维度大小，j是维度索引；

24、步骤s332：计算基于段均值的下界，所用公式如下：

25、；

26、式中，lbsm(x,y)是基于段均值sm(x)和段均值sm(y)的下界；

27、步骤s34：定义基于非线性嵌入的下界，包括：

28、步骤s341：计算数据方差，预先设第i段数据

29、，所用公式如下：

30、；

31、式中，是第i段数据中的方差；

32、步骤s342：非线性嵌入表示，基于算术平均值和方差值，数据点x的非线性嵌入表示为：；

33、步骤s343：计算非线性嵌入的下界，所用公式如下：

34、；

35、式中，lbne(x,y)是基于非线性嵌入的下界；和分别是非线性嵌入的向量y中第i段的均值和方差；

36、步骤s35：计算经济的下界，所用公式如下：

37、lb(x,y)=αlbbv(x,y)+βlbsm(x,y)+γlbne(x,y)；

38、式中，lb(·)是经济的下界；α、β和γ分别是基于块向量的下界、基于段均值的下界和基于非线性嵌入的下界的经济权重。

39、进一步地，在步骤s4中，所述参数搜索是对聚类用k值和经济权重进行搜索，具体包括以下步骤：

40、步骤s41：混沌初始化粒子群，基于三次映射生成粒子群，将基于粒子位置的聚类结果的calinski-harabasz指数作为个体适应度值，初始化粒子群所用公式如下：

41、；

42、式中，和分别是第n+1个和第n个粒子d维度的位置；是控制参数；

43、步骤s42：设计移动参数，当粒子适应度值高于粒子群平均适应度值时，自适应缩减移动参数，否则基于随机数增加搜索随机性；所用公式如下：

44、；

45、；

46、；

47、式中，是第k次迭代时的移动参数；和分别是最大移动参数和最小移动参数；是第i个粒子第k次迭代时的适应度值；和是粒子群的平均适应度值和最大适应度值；c1和c2分别是局部学习因子和全局学习因子；和分别是起始局部学习因子和终止局部学习因子；kmax是最大迭代次数；和分别是起始全局学习因子和终止全局学习因子；

48、步骤s43：设计移动策略，所用公式如下：

49、；

50、；

51、式中，和分别是第i个粒子d维度第k+1次迭代和第k次迭代时的速度；r1和r2是属于0到1的随机数且相互独立；是粒子个体历史最优位置；是粒子群最优位置；和分别是第i个粒子d维度第k+1次迭代和第k次迭代时的位置；a是加速度因子；

52、步骤s44：移动判定，预先设有适应度阈值，当存在粒子适应度值高于适应度阈值时，参数搜索完成；若达到最大迭代次数，则重新初始化粒子群搜索参数；否则继续迭代移动搜索参数。

53、进一步地，在步骤s5中，所述聚类具体包括以下步骤：

54、步骤s51：数据准备，获取数据集d={x1，x2，...，xn}、聚类中心数目k、初始聚类中心集合c={c1，c2，...，ck}和下界函数lb(·)；初始化迭代次数i=0，最大迭代次数maxitr；

55、步骤s52：初始化聚类中心，随机选择聚类中心，获取聚类中心集合c；

56、步骤s53：迭代聚类，当i≤maxitr或者未收敛时执行以下循环：

57、步骤s531：对于数据集中的每个数据点x，执行以下步骤：

58、步骤s5311：设置a(x)=none，bsf=+∞，其中a(x)是数据点所属的聚类中心；

59、步骤s532：对于每个聚类中心c，执行以下步骤：

60、步骤s5321：计算下界lb(x,c)；

61、步骤s533：如果lb(x,c)≤bsf，则执行以下步骤：

62、步骤s5331：计算欧几里得距离ed(x,c)；

63、步骤s534：如果ed(x,c)<bsf，则执行以下步骤：

64、步骤s5341：更新bsf=ed(x,c)，a(x)=c；

65、步骤s535：更新聚类中心集合c；

66、步骤s536：增加迭代次数i；

67、步骤s54：返回最终的聚类中心集合c；

68、步骤s55：数据整理，基于聚类结果实现病案信息整理统计。

69、采用上述方案本发明取得的有益效果如下：

70、（1）针对一般信息整理方法存在聚类时昂贵的计算导致资源和时间的浪费，异常值对聚类结果的影响过大从而导致聚类效果差的问题，本方案通过计算经济的下界避免不必要的欧氏距离的计算，减少计算复杂度；基于快向量、段均值和非线性嵌入的下界计算方式更全面考虑数据特征，增强聚类的鲁棒性；权衡多种下界更好地适应数据分布。

71、（2）针对一般信息整理方法存在聚类时参数选取不当导致聚类结果不精准，搜索方法收敛性差的问题，本方案基于三次映射初始化粒子群，设计自适应缩减移动参数激励粒子密集搜索，加速收敛，提高搜索效率；权衡局部搜索和全局搜索设计移动策略，提高搜索准确性。

技术特征：

1.一种基于人工智能的病案信息管理方法，其特征在于：该方法包括以下步骤：

2.根据权利要求1所述的一种基于人工智能的病案信息管理方法，其特征在于：在步骤s3中，所述定义经济的下界具体包括以下步骤：

3.根据权利要求1所述的一种基于人工智能的病案信息管理方法，其特征在于：在步骤s5中，所述聚类具体包括以下步骤：

4.根据权利要求1所述的一种基于人工智能的病案信息管理方法，其特征在于：在步骤s1中，所述数据采集是采集用户基本信息、病史信息、患者症状、治疗方案和医疗机构信息。

5.根据权利要求1所述的一种基于人工智能的病案信息管理方法，其特征在于：在步骤s2中，所述数据预处理是对采集的数据进行数据清洗、数据转换和数据标准化处理；所述数据清洗包括缺失值处理和异常值处理；所述数据转换是对数据类型进行独热编码处理作为特征的维度，将文本数据转换为向量；所述数据标准化处理是利用z-score标准化对每一个维度的数据进行归一化处理。

技术总结
本发明公开了一种基于人工智能的病案信息管理方法，方法包括数据采集、数据预处理、定义经济的下界、参数搜索和聚类。本发明属于数据处理技术领域，具体是指一种基于人工智能的病案信息管理方法，本方案通过计算经济的下界避免不必要的欧氏距离的计算，减少计算复杂度；基于快向量、段均值和非线性嵌入的下界计算方式更全面考虑数据特征，增强聚类的鲁棒性；基于三次映射初始化粒子群，设计自适应缩减移动参数激励粒子密集搜索，加速收敛，提高搜索效率；权衡局部搜索和全局搜索设计移动策略，提高搜索准确性。

技术研发人员：戴子卿,陈宇,荣霞,刘琪,邹文
受保护的技术使用者：中国人民解放军总医院第六医学中心
技术研发日：
技术公布日：2024/4/29

转载请注明原文地址:https://wp.8miu.com/read-95955.html

专利

最新回复(0)