一种基于距离感知的知识追踪方法

    专利2025-06-12  45


    本发明涉及机器学习、人工智能和智能教育,具体的说是一种基于距离感知的知识追踪方法。


    背景技术:

    1、知识追踪作为智慧教育中一项重要的技术,它主要对学生的能力状态进行建模,从而准确地预测学生在未来答题中的表现。随着学生答题数量的增加,学生的能力状态也在不断发生着变化。知识追踪的目的就是要捕捉这些变化,以建模学生的最终能力状态。深度神经网络是现在非常热门的一项技术,越来越多的研究人员开始将神经网络和知识追踪结合起来,许多工作利用文本信息或知识概念的关系来丰富学生和练习的相关表征,或者利用神经网络来拟合学生和练习之间复杂的交互作用,这些工作为知识追踪领域的发展做出了巨大贡献。

    2、尽管知识追踪已经取得了显著的成果,但仍面临许多挑战。其中一个主要问题是现有方法认为学生每次作答对能力的提升或下降是固定的,这样往往忽略了学生答题过程中的不确定性,这种不确定性可能源于多个因素,例如猜题、习惯性作答等,而且随着时间的推移学生在作答过程中可能会出现知识遗忘等状态,这些因素或状态可能会严重影响对学生能力的评估,使得学生的能力表征不再可靠。因此,需要更加关注这个问题,并采取措施来提高预测的准确性。


    技术实现思路

    1、为了解决上述问题,本发明提出了一种基于距离感知的知识追踪方法,通过将学生能力建模成分布的方式,刻画出学生答题过程中能力表征的不确定性,再利用霍克斯过程捕捉时间对学生能力表征的影响,从而实现更加准确的预测学生答题表现。

    2、本发明为达到上述发明目的,采用如下技术方案:

    3、本发明一种基于距离感知的知识追踪方法的特点在于,是按如下步骤进行:

    4、步骤一、定义学生集s={s1,s2,...,si,...,si},其中,si表示第i个学生,i为学生的数量;

    5、定义习题集q={q1,q2,...,qj,...,qj},其中,qj表示第j个练习,j为习题的总数;

    6、定义答题的时间集t={t1,t2,...,tj,...,tj},tj表示第j个练习qj作答的时刻;

    7、定义知识概念集c={c1,c2,...,ck,...,ck},其中,ck表示第k个知识概念,k为知识概念的数量;

    8、令第i个学生si对第j个习题qj的真实作答结果为ri,j,若ri,j=1,表示第i个学生si正确作答第j个习题qj,若ri,j=0,表示第i个学生si错误作答第j个习题qj;

    9、定义第i个学生si的答题日志xi=[xi,1,xi,2,...,xi,n,...,xi,n],其中,xi,n表示第n个日志,且xi,n=(qi,n,ci,n,ti,n),qi,n表示第i个学生si作答的第n个练习qn,ci,n表示第i个学生si作答的第n个练习qn的知识概念,ti,n表示第i个学生si作答的第n个练习qn的时刻;n表示日志总数,且n≤j;

    10、定义第i个学生si的答题记录yi=[yi,1,yi,2,...,yi,n,...,yi,n],其中,yi,n表示第n个记录,且yi,n=(qi,n,ci,n,ti,n,ri,n),ri,n表示第i个学生si作答的第n个练习qn的作答结果;

    11、步骤二、不确定性嵌入模块分别对答题日志xi,n和答题记录yi,n进行嵌入处理,相应得到xi,n的均值嵌入和协方差嵌入以及yi的均值嵌入和协方差嵌入

    12、步骤三、表征学习模块分别对和以及和进行处理,相应得到第n个日志xi,n最终的能力表征

    13、步骤四、预测模块根据能力表征对第i个学生si正确作答第n+1个练习qn+1进行预测,得到预测作答结果

    14、步骤五、利用式(16)构建损失函数l,并对由不确定性嵌入模块、表征学习模块和预测模块构成的距离感知的知识追踪网络进行训练,并最小化总损失函数l以更新模型参数,直至收敛为止,得到最优的学生能力表征以预测学生未来作答结果

    15、

    16、式(16)中,ri,n+1表示第i个学生si作答第n+1个练习qn+1的真实作答结果。

    17、本发明所述的一种基于距离感知的知识追踪方法的特点也在于,所述步骤二包括:

    18、步骤2.1、利用式(1)和(2)得到第i个学生si的答题日志xi的嵌入:

    19、

    20、

    21、式(1)和(2)中,表示第n个日志xi,n的均值嵌入,表示第n个日志xi,n的协方差嵌入,表示答题日志xi中第n个日志xi,n的位置均值嵌入,表示答题日志xi中第n个日志xi,n的位置协方差嵌入,并有:

    22、

    23、式(5)中,表示不确定性嵌入模块中待训练的两个参数矩阵;index(i,n)表示日志xi,n在答题日志xi中的绝对位置;

    24、步骤2.2、利用式(3)和式(4)得到第i个学生si的答题记录yi的嵌入:

    25、

    26、

    27、式(3)和式(4)中,表示第n个记录yi,n的均值嵌入,表示第n个记录yi,n的协方差嵌入。

    28、所述步骤三包括:

    29、步骤3.1、利用式(6)得到第n个日志xi,n的随机嵌入其中,表示高斯分布:

    30、

    31、式(6)中,表示第n个日志xi,n的随机均值嵌入,表示第n个日志xi,n的随机协方差嵌入,diag表示取对角元素为列向量,和表示表征学习模块中待训练的两个日志参数矩阵,elu为激活函数;

    32、步骤3.2、利用式(7)得到第k个日志xi,k与第n个日志xi,n的注意力得分ai,k,n:

    33、

    34、式(7)中,w2(·,·)表示2-wasserstein距离公式,||·,·||2表示计算2范数,trace表示迹运算,且k<n;

    35、步骤3.3、利用式(8)得到第k个日志xi,k与第n个日志xi,n之间归一化后的注意力权重

    36、

    37、式(8)中,ai,m,n表示第m个日志xi,m与第n个日志xi,n的注意力得分;

    38、步骤3.4、利用式(9)得到日志xi,n的隐变量:

    39、

    40、式(9)中,表示第n个日志xi,n的均值隐变量,表示n个日志xi,n的协方差隐变量,表示第k个记录yi,k的随机均值嵌入,表示答第k个记录yi,k的随机均值嵌入,并有:

    41、

    42、式(10)中,和表示表征学习模块中待训练的两个记录参数矩阵;

    43、步骤3.5、利用式(11)计算第n个日志xi,n的初步表征;

    44、

    45、式(11)中,表示第n个日志xi,n的均值初步表征,表示第n个日志xi,n的协方差初步表征,dropout表示正则化,layernorm表示层归一化,ffn表示前馈神经网络;

    46、步骤3.6、利用式(12)得到第n个日志xi,n的最终表征

    47、

    48、式(12)中,表示第i个学生si的基础表征,表示第i个学生si的不确定性表征,ti,n-1表示第i个学生si作答的第n-1个练习qn-1的时刻,softplus表示激活函数,表示均值基础强度,表示协方差基础强度,表示均值触发强度,表示协方差触发强度,表示均值衰减因子和,表示协方差衰减因子,并有:

    49、

    50、式(13)中,gelu表示激活函数,表示表征学习模块中的用于学习学生基础能力的三个待训练参数矩阵;表示表征学习模块中用于学习学生答题过程中不确定性的三个待训练参数矩阵。

    51、所述步骤四中的预测模块是利用式(14)得到第i个学生si正确作答第n+1个练习qn+1的预测作答结果

    52、

    53、式(14)中,sigmoid表示激活函数,表示第i个学生si作答第n+1个练习qn+1的随机分布嵌入,并有:

    54、

    55、式(15)中,表示第i个学生si作答第n+1个练习qi,n+1的随机均值嵌入,表示第i个学生si作答第n+1个练习qi,n+1的随机协方差嵌入,表示第i个学生si作答第n+1个练习qi,n+1的均值嵌入,表示第i个学生si作答第n+1个练习qi,n+1的协方差嵌入,和表示待训练的两个参数矩阵。

    56、本发明一种电子设备,包括存储器以及处理器的特点在于,所述存储器用于存储支持处理器执行所述的知识追踪方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

    57、本发明一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序的特点在于,所述计算机程序被处理器运行时执行所述的知识追踪方法的步骤。

    58、与现有技术相比,本发明具有以下有益效果:

    59、本发明旨在描述学生能力表征的不确定性,提出了一种通过答题日志间距离计算学生能力表征的方法。首先,采用不同的嵌入方式将学生的能力表示为一个分布,并利用该分布的协方差来描述学生答题过程中存在的不确定性。同时,使用霍克斯过程将遗忘等状态对学生的影响融入到模型中。最后,利用二元交叉熵损失函数,进一步确保所得到评估更为准确合理。采用这一方法,充分考虑了学生答题过程中不确定因素对学生能力表征的影响,使得获得的学生能力表征更具可解释性,从而提高了预测精确度。


    技术特征:

    1.一种基于距离感知的知识追踪方法,其特征在于,是按如下步骤进行:

    2.根据权利要求1所述的一种基于距离感知的知识追踪方法,其特征在于,所述步骤二包括:

    3.根据权利要求2所述的一种基于距离感知的知识追踪方法,其特征在于,所述步骤三包括:

    4.根据权利要求3所述的一种基于距离感知的知识追踪方法,其特征在于,所述步骤四中的预测模块是利用式(14)得到第i个学生si正确作答第n+1个练习qn+1的预测作答结果

    5.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1-4中任一所述的知识追踪方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

    6.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-4中任一所述的知识追踪方法的步骤。


    技术总结
    本发明公开了一种基于距离感知的知识追踪方法,其步骤包括:1、将学生的答题日志和答题记录建模为分布,其中分布中的均值嵌入表示学生的基本能力,协方差嵌入表示学生能力中的不确定性;2、采用一种基于Wasserstein距离的注意力机制得到学生能力的初步表征;3、利用霍克斯过程将学生做题过程中存在的时间影响融入模型之中并得到学生的最终能力表征;4、根据学生的最终能力表征预测学生未来的答题表现,并采用交叉熵损失优化整个知识追踪网络,得到最优知识追踪模型。本发明不仅对学生答题过程中存在的不确定性进行建模,而且分析了时间对学生能力的影响,从而能更加准确的预测学生作答表现。

    技术研发人员:曹明阳,马海平,杨尚尚,张兴义
    受保护的技术使用者:安徽大学
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-88096.html

    最新回复(0)