本技术涉及数据处理,特别是涉及一种题目推荐方法、装置、计算机设备和存储介质。
背景技术:
1、习题练习可以巩固学生的知识,推荐难度适中的习题可以指引学生正确的学习方向,为学生提供个性化服务,同时还可以激发学生的学习兴趣。
2、传统的题目推荐方法有协同过滤方法,主要依赖学生之间的相似度或者习题之间的相似度来进行推荐。这种方法会导致推荐过于局限,仅仅基于相似度来推荐习题无法提供多样性的学习资源。无法全面准确地反映学生的学习需求和习题的难度,传统的难度评估方法通常需要构建大量的历史题目集,并对历史题目进行得分率标注,以得到相似题目的题目难度,这个过程需要大量的人力和时间投入,计算成本较高。此外,传统的相似度分析在确定对比目标时范围较广,难以迅速准确地找到所属类型。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种题目推荐方法、装置、计算机设备和存储介质。
2、一种题目推荐方法,所述方法包括:
3、获取题目集;所述题目集包括用户学习课程的题库;
4、从所述题目集中抽取小样本题目集,根据所述小样本题目集得到若干原型中心;所述小样本题目集包括若干类别的题目;
5、根据题目与所述若干原型中心的相似性距离中的最小值,得到题目对应的距离相似性,根据题目信息计算得到题目复杂度,根据所述距离相似性和所述题目复杂度,得到难度距离模型;
6、利用所述题目集训练所述难度距离模型,迭代更新所述题目集中的原型中心,直到不再出现新的原型中心时,停止迭代,得到训练好的难度距离模型;
7、根据所述训练好的难度距离模型计算得到所述题目集中每一题目的题目难度系数,根据所述题目难度系数以及每一题目与当前每一原型中心的余弦相似性,构建难度图谱;
8、查找所述难度图谱中当前用户学习题目的相似题目,搜索所述相似题目中与所述用户学习题目的题目难度系数最接近的题目,得到推荐题目。
9、在其中一个实施例中,还包括:根据所述距离相似性和所述题目复杂度,得到难度距离模型为:
10、dif=a*l+b*k+c*u+d*∑(oi*ci)+e*s+f*min(e)
11、其中,dif为题目难度系数,p=a*l+b*k+c*u+d*∑(oi*ci)+e*s,p为题目复杂度,min(e)为距离相似性,l为题目长度,k为已知信息数量,u为未知数数量,oi为计算操作类型,ci为计算操作数量,i为题目解析中的公式编号,s为解题策略复杂度,a、b、c、d、e、f为权重系数。
12、在其中一个实施例中,还包括:计算所述题目集中其他题目到当前每一原型中心的距离相似性和题目复杂度,若当前题目到当前每一原型中心的距离相似性的绝对值大于预先设置的第一阈值,且题目复杂度均大于预先设置的第二阈值时,将当前题目作为新的原型中心;迭代更新所述题目集中的原型中心,直到不再出现新的原型中心时,停止迭代,得到训练好的难度距离模型。
13、在其中一个实施例中,还包括:根据每一题目与当前每一原型中心的余弦相似性,确定每一题目与当前每一原型中心的夹角;根据所述题目难度系数,确定每一题目到当前每一原型中心的距离;根据每一题目与当前每一原型中心的夹角和距离,构建难度图谱。
14、在其中一个实施例中,还包括:查找所述难度图谱中与所述用户学习题目距离最近的原型中心,根据所述难度图谱中与所述原型中心的距离小于预先设置的阈值的题目,得到相似题目。
15、在其中一个实施例中,还包括:采用题目特征提取方法提取所述题目集中题目的题目文本信息,得到题目向量;根据当前题目的题目向量和所述若干原型中心的题目向量,计算得到当前题目与若干原型中心的相似性距离。
16、在其中一个实施例中,还包括:提取所述题目集中题目的题目文本信息;所述题目文本信息包括题面信息、答案信息和解析信息;分别对所述题面信息、所述答案信息和所述解析信息的中文和公式进行切割,根据中文和公式的语义信息,得到题面特征向量、答案特征向量和解析特征向量;根据所述题面特征向量、所述答案特征向量和所述解析特征向量,得到题目向量。
17、一种题目推荐装置,所述装置包括:
18、题目集获取模块,用于获取题目集;所述题目集包括用户学习课程的题库;
19、原型中心确定模块,用于从所述题目集中抽取小样本题目集,根据所述小样本题目集得到若干原型中心;所述小样本题目集包括若干类别的题目;
20、模型构建模块,用于根据题目与所述若干原型中心的相似性距离中的最小值,得到题目对应的距离相似性,根据题目信息计算得到题目复杂度,根据所述距离相似性和所述题目复杂度,得到难度距离模型;
21、模型训练模块,用于利用所述题目集训练所述难度距离模型,迭代更新所述题目集中的原型中心,直到不再出现新的原型中心时,停止迭代,得到训练好的难度距离模型;
22、难度图谱构建模块,用于根据所述训练好的难度距离模型计算得到所述题目集中每一题目的题目难度系数,根据所述题目难度系数以及每一题目与当前每一原型中心的余弦相似性,构建难度图谱;
23、题目推荐模块,用于查找所述难度图谱中当前用户学习题目的相似题目,搜索所述相似题目中与所述用户学习题目的题目难度系数最接近的题目,得到推荐题目。
24、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
25、获取题目集;所述题目集包括用户学习课程的题库;
26、从所述题目集中抽取小样本题目集,根据所述小样本题目集得到若干原型中心;所述小样本题目集包括若干类别的题目;
27、根据题目与所述若干原型中心的相似性距离中的最小值,得到题目对应的距离相似性,根据题目信息计算得到题目复杂度,根据所述距离相似性和所述题目复杂度,得到难度距离模型;
28、利用所述题目集训练所述难度距离模型,迭代更新所述题目集中的原型中心,直到不再出现新的原型中心时,停止迭代,得到训练好的难度距离模型;
29、根据所述训练好的难度距离模型计算得到所述题目集中每一题目的题目难度系数,根据所述题目难度系数以及每一题目与当前每一原型中心的余弦相似性,构建难度图谱;
30、查找所述难度图谱中当前用户学习题目的相似题目,搜索所述相似题目中与所述用户学习题目的题目难度系数最接近的题目,得到推荐题目。
31、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
32、获取题目集;所述题目集包括用户学习课程的题库;
33、从所述题目集中抽取小样本题目集,根据所述小样本题目集得到若干原型中心;所述小样本题目集包括若干类别的题目;
34、根据题目与所述若干原型中心的相似性距离中的最小值,得到题目对应的距离相似性,根据题目信息计算得到题目复杂度,根据所述距离相似性和所述题目复杂度,得到难度距离模型;
35、利用所述题目集训练所述难度距离模型,迭代更新所述题目集中的原型中心,直到不再出现新的原型中心时,停止迭代,得到训练好的难度距离模型;
36、根据所述训练好的难度距离模型计算得到所述题目集中每一题目的题目难度系数,根据所述题目难度系数以及每一题目与当前每一原型中心的余弦相似性,构建难度图谱;
37、查找所述难度图谱中当前用户学习题目的相似题目,搜索所述相似题目中与所述用户学习题目的题目难度系数最接近的题目,得到推荐题目。
38、上述题目推荐方法、装置、计算机设备和存储介质,通过在大样本的题目集中确定小样本的原型中心,利用确定好的原型中心构建难度距离模型,采用题目集训练难度距离模型,迭代更新原型中心,直到不再出现新的原型中心时,得到训练好的难度距离模型,利用训练好的难度距离模型计算题目集中每一题目的题目难度系数,从而根据题目难度系数以及每一题目与当前每一原型中心的余弦相似性,构建难度图谱,通过难度图谱可以直观地查找用户学习题目的相似题目,在相似题目中查找与用户学习题目的题目难度系数最接近的题目,就可以得到推荐题目。本发明实施例,能够降低计算与检索的复杂程度,以及提高题目推荐的准确性。
1.一种题目推荐方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述距离相似性和所述题目复杂度,得到难度距离模型包括:
3.根据权利要求1或2所述的方法,其特征在于,所述利用所述题目集训练所述难度距离模型,迭代更新所述题目集中的原型中心,直到不再出现新的原型中心时,停止迭代,得到训练好的难度距离模型的步骤,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述题目难度系数以及每一题目与当前每一原型中心的余弦相似性,构建难度图谱的步骤,包括:
5.根据权利要求1所述的方法,其特征在于,所述查找所述难度图谱中所述用户学习题目的相似题目的步骤,包括:
6.根据权利要求1所述的方法,其特征在于,得到题目与所述若干原型中心的相似性距离的步骤包括:
7.根据权利要求6所述的方法,其特征在于,所述采用题目特征提取方法提取所述题目集中题目的题目文本信息,得到题目向量包括:
8.一种题目推荐装置,其特征在于,所述装置包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
