一种基于原型补全的小样本学习方法

专利2026-06-10 1

本发明属于深度学习领域，具体涉及一种基于原型补全的小样本学习方法。

背景技术：

1、当前的深度学习模型主要依赖于大量的有标签的训练数据进行自适应并避免过拟合。然而在某些领域，要获取充足的训练数据是非常困难的。例如，在医疗领域，一方面希望能够借助深度学习的技术对眼底、皮肤病等医学图像进行辅助性诊断，帮助医护人员判断出医学图像中的病变位置；但是另一方面，由于要保护病患隐私，往往无法获取大量的医学图像。此外，即使能够获取大量的样本数据，给这些数据打上标签会耗费大量的人力和财力。在少量的数据样本上进行训练，会使深度学习模型更易收敛至局部最优，导致模型的泛化能力弱、无法准确地表达样本特征。而小样本学习能够模拟人类从少数的实例中学习知识并快速适应新任务的能力，训练网络从少量的有标签的样本中学习和理解新概念，能够很好地解决深度学习模型在少量样本上的过拟合问题，因此小样本学习领域具有重要的应用价值和广阔的研究前景。

2、现有技术针对小样本学习有了较为成熟的研究，如：基于度量学习的小样本学习方法专注于获取一个良好的度量空间，并使用基于欧几里得距离或余弦距离的最近质心分类器对查询样本进行分类，如matching network(匹配网络)及其变体和prototypicalnetwork(原型网络)及其变体。但是如何解决类原型偏置问题，现有的基于度量学习的小样本学习模型在计算类原型特征时往往是直接将支持样本特征相加然后求平均值，如果样本中含有大量的背景信息或者其他无关类别的目标对象，计算得到的类原型在特征空间内无法代表对应类别，从而导致分类结果不准确。如何获取和利用全局特征，基于度量的小样本学习模型是在元学习框架下实现的，元学习随机抽取样本生成小样本任务，而基于度量学习的方法计算每一个小样本任务中的支持集的原型并计算与查询样本的欧氏距离以对查询样本进行分类，每一个小样本任务中的支持样本数量少，计算得到的原型可能会有所偏移，同时，每一个小样本任务之间是独立的，元学习器不能有效学习全局的特征。

技术实现思路

1、为解决上述技术问题，本发明提供一种基于原型补全的小样本学习方法，针对公开数据集miniimagenet和tieredimagenet，实现了在少量数据上的图像分类任务，包括：

2、s1：构建一个分类模型ft，该分类模型由特征提取器fθ和分类器g0构成，基于全监督的对比学习损失函数进行预训练，其中，全监督的对比学习损失函数利用了样本的标签信息，将属于同一类别的样本都设置为正样本，而不同类别的样本设置为负样本；

3、s2：构建一个教师-学生模型，其中，以ft作为教师模型，并构建一个与ft同结构的学生模型fs，fs由特征提取器和分类器g1构成；教师模型监督学生模型的训练过程，使学生模型能够识别样本中的前景和背景部分；

4、s3：从数据集随机抽取样本生成小样本任务，并通过预训练后的特征提取器提取支持样本和查询样本的特征，通过计算属于同一类别的样本特征的平均值获取对应类别的原型；

5、所述小样本任务包括支持样本和查询样本；

6、s4：构建一个内存模块，存储每一个小样本学习任务计算的类原型；

7、s5：构建门控循环单元gru，对于每一个小样本学习任务，都将计算出的类原型与内存模块中存储的对应类别的原型输入门控循环单元gru中，门控循环单元gru通过重置门和更新门对计算出的类原型进行更新，同时，更新后的类原型重新存储到内存模块，作为下一个任务的输入；

8、s6：计算查询样本和更新后的类原型之间的欧几里得距离，表示查询样本属于更新后的类原型的概率，来对样本分类。

9、本发明的有益效果：

10、本发明构建了一个基于知识蒸馏的教师-学生模型，以增强特征提取器区分图像样本前景和背景区域的能力，减少了大量背景信息和其他无关类别信息带来的不良影响，减轻了原型偏置的问题；

11、本发明通过构造一个内存模块来存储在每个小样本任务中计算的原型，并通过门控循环单元对其进行更新；通过这种方式获取并融合不同任务中的类别原型，使计算得到的类原型包含全局的特征，在特征空间更能代表对应类别的特征，缓解了由于缺乏样本而导致的原型偏差问题。

技术特征：

1.一种基于原型补全的小样本学习方法，其特征在于，针对公开数据集miniimagenet和tieredimagenet，实现了在少量数据上的图像分类任务，包括：

2.根据权利要求1所述的一种基于原型补全的小样本学习方法，其特征在于，全监督的对比学习损失函数，包括：

3.根据权利要求1所述的一种基于原型补全的小样本学习方法，其特征在于，教师模型监督学生模型的训练过程，使学生模型能够识别样本中的前景和背景部分，包括：

4.根据权利要求3所述的一种基于原型补全的小样本学习方法，其特征在于，将区域分片分别输入到教师模型和学生模型中，通过特征提取器进行特征提取，将提取的特征向量分别输入到对应的分类器计算分类置信分数，包括：

5.根据权利要求3所述的一种基于原型补全的小样本学习方法，其特征在于，全局损失和局部损失，包括：

6.根据权利要求1所述的一种基于原型补全的小样本学习方法，其特征在于，通过计算属于同一类别的样本特征的平均值获取对应类别的原型，包括：

7.根据权利要求1所述的一种基于原型补全的小样本学习方法，其特征在于，门控循环单元gru通过重置门和更新门对计算出的类原型进行更新，包括：

8.根据权利要求1所述的一种基于原型补全的小样本学习方法，其特征在于，计算查询样本和更新后的类原型之间的欧几里得距离，表示查询样本属于更新后的类原型的概率，包括：

技术总结
本发明属于深度学习领域，具体涉及一种基于原型补全的小样本学习方法，包括：构建一个教师‑学生模型包括f<subgt;t</subgt;为教师模型和f<subgt;t</subgt;同结构的学生模型f<subgt;s</subgt;，教师模型监督学生模型的训练过程；通过预训练后的特征提取器提取支持样本和查询样本的特征，通过计算属于同一类别的样本特征的平均值获取对应类别的原型；构建门控循环单元对计算出的类原型进行更新，并存储到内存模块；计算查询样本和更新后的类原型之间的欧几里得距离来对样本分类。本发明构建了一个基于知识蒸馏的教师‑学生模型，减轻了原型偏置的问题；并通过门控循环单元对其进行更新，缓解了由于缺乏样本而导致的原型偏差问题。

技术研发人员：张旭,王新月,张晨晨,钟雨汝
受保护的技术使用者：重庆邮电大学
技术研发日：
技术公布日：2024/4/29

转载请注明原文地址:https://wp.8miu.com/read-97639.html

专利

最新回复(0)