本发明涉及自然语言处理
技术领域:
,特别是涉及一种仪器项目申报评审专家匹配方法、装置、设备和介质。
背景技术:
:大型仪器设施共享,在中央及各个地方政府都通过了相关立法。而要有效的推广大型仪器设施的共享,每年的新购仪器申请是一个关键点。对仪器申报项目高效、公平、合理的评审,即可以在有限的购买资金下,引导产业发展,同时也可有效的推广仪器设施共享。而在仪器申报项目审批评审环节中,匹配到相应的行业专家是保证项目能公平高效获得评审前提条件。一直以来,评审机构都是采用人工阅读申报内容,再根据内容,把需要评审的项目进行合并,归类,形成一个评审组,再去找到相关的领域专家,形成专家评审组。而对于有多项大分类,一百多项小分类的仪器,操作人员必须对这些信息了熟于心,这样需要非常长的学习和熟悉成本。另外一方面,还需要对领域专家的特长都有所了解,也需要耗费大量的资源和时间。技术实现要素:鉴于以上所述现有技术的缺点,本申请的目的在于提供一种仪器项目申报评审专家匹配方法、装置、设备和介质,以解决现有技术中的问题。为实现上述目的及其他相关目的,本申请提供一种仪器项目申报评审专家匹配方法,所述方法包括:构建划分有多种仪器种类、及多种业务维度的指标库;依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,并对各种类分组内的全部仪器项目按业务维度进行相似性聚类,以在各组内得到一或多个待评审项目分组;汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词;依据匹配词从评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。于本申请的一实施例中,所述指标库中针对各仪器种类分别构建不同层次结构关系的语义字典;和/或,针对各业务维度分别设置不同权重值。于本申请的一实施例中,所述依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,包括:将各仪器项目的项目内容分别利用各仪器种类对应的语义字典,以计算对应至不同业务维度的相关度分数;其中,依据两词语在语义字典中的公共祖先结点具有的最大信息量来计算两词语的相关度;分别将对应各业务维度的相关度分数与权重值相乘,以计算对应不同仪器种类的总分数;将总分数为最大的仪器种类作为各仪器项目对应的仪器种类,以供对各仪器项目按仪器种类进行种类分组。于本申请的一实施例中,所述汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词,包括:将各待评审项目分组的组内所有内容信息按各业务维度分别进行汇总;对各待评审项目分组所汇总的内容信息进行智能分词,并统计每个词语出现的次数;选择出现次数较多的多个词语以作为各待评审项目分组的匹配词。于本申请的一实施例中,所述仪器种类包括:分析仪器、物理性能测试仪器、计量仪器、电子测量仪器、海洋仪器、地球探测仪器、大气探测仪器、天文仪器、医学诊断仪器、核仪器、特种检测仪器、工艺试验设备、计算机及其配套设备、激光器、及其他仪器中任意一种或多种组合。于本申请的一实施例中,所述业务维度包括:涉及的领域、单位科研水平、购买的必要性、设备的紧急性、设备的技术指标、设备性能配置、设备的先进性、设备的适应性、使用用途、可应用领域、国内设备使用情况、单位科研队伍、及设备运维技术队伍中任意一种或多种组合。于本申请的一实施例中,所述依据匹配词在评审专家库中为各待评审项目分组匹配多位评审专家,包括:将各待评审项目分组对应的匹配词与评审专家库中各评审专家对应的专家信息进行比对,并利用bm25算法计算相关性,以分别初步确定多位专家;依据专家信息对初步确定的各位专家采用相关性回避算法进行筛选以得到最终的专家分组。为实现上述目的及其他相关目的,本申请提供一种仪器项目申报评审专家匹配装置,所述装置包括:指标库模块,用于构建划分有多种仪器种类、及多种业务维度的指标库;分组模块,用于依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,并对各种类分组内的全部仪器项目按业务维度进行聚类,以在各组内得到一或多个待评审项目分组;匹配词模块,用于汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词;专家匹配模块,用于依据匹配词在评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。为实现上述目的及其他相关目的,本申请提供一种计算机设备,所述设备包括:存储器、及处理器;所述存储器用于存储计算机指令;所述处理器运行计算机指令实现如上所述的方法。为实现上述目的及其他相关目的,本申请提供一种计算机可读存储介质,存储有计算机指令,所述计算机指令被运行时执行如上所述的方法。综上所述,本申请的一种仪器项目申报评审专家匹配方法、装置、设备和介质,通过构建划分有多种仪器种类、及多种业务维度的指标库;依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,并对各种类分组内的全部仪器项目按业务维度进行相似性聚类,以在各组内得到一或多个待评审项目分组;汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词;依据匹配词从评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。具有以下有益效果:本申请一方面将全部申报的仪器项目进行了精细的聚类待评审项目分组,并且针对各聚类后的待评审项目分组针对性的匹配专家组,能够减少评审专家的数量,实现更少的专家评审更多的项目,大大提高了项目评审匹配专家的效率,还可以高效的排查出需要回避的专家,进行自动回避筛选。另外,本申请所述方法替代了人工阅读项目申报书,人工分类的方法。附图说明图1显示为本申请于一实施例中仪器项目申报评审专家匹配方法的流程示意图。图2显示为本申请于一实施例中展示为关注不同核心词语的层级结构关系的模型示意图图。图3显示为本申请于一实施例中的仪器项目申报评审专家匹配装置的模块示意图。图4显示为本申请于一实施例中的计算机设备的结构示意图。具体实施方式以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本申请的基本构想,虽然图式中仅显示与本申请中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,但其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。在通篇说明书中,当说某部分与另一部分“连接”时,这不仅包括“直接连接”的情形,也包括在其中间把其它元件置于其间而“间接连接”的情形。另外,当说某种部分“包括”某种构成要素时,只要没有特别相反的记载,则并非将其它构成要素,排除在外,而是意味着可以还包括其它构成要素。其中提到的第一、第二及第三等术语是为了说明多样的部分、成分、区域、层及/或段而使用的,但并非限定于此。这些术语只用于把某部分、成分、区域、层或段区别于其它部分、成分、区域、层或段。因此,以下叙述的第一部分、成分、区域、层或段在不超出本申请范围的范围内,可以言及到第二部分、成分、区域、层或段。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“a、b或c”或者“a、b和/或c”意味着“以下任一个:a;b;c;a和b;a和c;b和c;a、b和c”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。为解决上述问题,本申请提出了一种仪器项目申报评审专家匹配方法、装置、设备和介质,利用nlp的技术,来实现申报项目和专家的高度匹配,达到快速形成专家评审组的功能。如图1所示,展示为本申请一实施例中的仪器项目申报评审专家匹配方法的流程示意图。如图所示,所述方法包括:步骤s101:构建划分有多种仪器种类、及多种业务维度的指标库。优选地,本申请根据历年仪器项目申报信息,按照应用领域和仪器原理相结合的分类原则,对仪器进行分类。所述仪器种类包括但不限于:分析仪器、物理性能测试仪器、计量仪器、电子测量仪器、海洋仪器、地球探测仪器、大气探测仪器、天文仪器、医学诊断仪器、核仪器、特种检测仪器、工艺试验设备、计算机及其配套设备、激光器、及其他仪器中任意一种或多种组合。举例来说,如上列出的至少15类仪器种类,可如表1所示。表1仪器种类列表分类序号名称t1分析仪器t2物理性能测试仪器t3计量仪器t4电子测量仪器t5海洋仪器t6地球探测仪器t7大气探测仪器t8天文仪器t9医学诊断仪器t10核仪器t11特种检测仪器t12工艺实验设备t13计算机及其配套设备t14激光器t15其他仪器基于上述至少15类仪器的分类,在根据历年申报的项目数据,按照业务区别提取业务维度指标。优选地,所述业务维度包括但不限于:涉及的领域、单位科研水平、购买的必要性、设备的紧急性、设备的技术指标、设备性能配置、设备的先进性、设备的适应性、使用用途、可应用领域、国内设备使用情况、单位科研队伍、及设备运维技术队伍中任意一种或多种组合。于本申请一实施例中,针对各仪器种类分别构建不同层次结构关系的语义字典;和/或,针对各业务维度分别设置不同权重值。于本申请中,根据历年申报的项目数据,构建具有层次结构关系的语义词典。简单来说,词语直接的距离是层次的,在不同的种类(或大类)里面,要关注的核心词语是不一样的,那么不同种类仪器对应的层级结构关系或层级结构关系也是不一样的。如图2所示,展示为关注不同核心词语的层级结构关系的模型示意图。其中,对于不同种类仪器的功能、需求、痛点等是不同的,所构建的词义字典的层次结构关系也必然不同。另外,语义词典对应t1-t15的业务维度相同,但内容不同,即本申请相当于提供了15*13组进行匹配的信息。为便于后续的项目比对,还对这些业务维度的字段指标,按照业务的情况,赋予相应权重(kwi)。举例来说,上述至少13类业务维度的划分及对应的权重值,可如表2所示。表2维度权重分配表权重序号业务维度权重值(%)kw1涉及的领域10kw2单位科研水平5kw3购买的必要性6kw4设备的紧急性4kw5设备的技术指标20kw6设备性能配置15kw7设备的先进性3kw8设备的适应性10kw9使用用途7kw10可应用领域7kw11国内设备使用情况5kw12单位科研队伍5kw13设备运维技术队伍3至此,本申请的指标库构建完成,该指标库内的仪器种类、及业务维度的划分均是基于历年仪器项目申报的特点、及评审经验而完成的,其具有较高的针对性和普适性,几乎能适用任何参与申报的仪器种类。步骤s102:依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,并对各种类分组内的全部仪器项目按业务维度进行相似性聚类,以在各组内得到一或多个待评审项目分组。于本申请一实施例中,所述依据所述指标库对申报的若干个仪器项目按仪器种类进种类行分组,包括:a、将各仪器项目的项目内容分别利用各仪器种类对应的语义字典,以计算对应至不同业务维度的相关度分数;其中,依据两词语在语义字典中的公共祖先结点具有的最大信息量来计算两词语的相关度;b、分别将对应各业务维度的相关度分数与权重值相乘,以计算对应不同仪器种类的总分数;c、将总分数为最大的仪器种类作为各仪器项目对应的仪器种类,以供对各仪器项目按仪器种类进行种类分组。简单来说,按照上述的业务维度和构建的语义字典,采用两词语在词典中的公共祖先结点所具有的最大信息量来计算词语的相关度的方式,将每个仪器项目按照各个分类上的语义字典,计算分别在各个业务维度上获得相应的分数si(t),其中,i表示表示每个业务维度上的分数;t表示在那个分类上。例如,对应上述举例的表1与表2,1≤i≤13;1≤t≤15。根据下面的公式:其中,g(t)表示如上述15类中最大的求和数,t表示第多少类。g(t)是相关性最大的数,按照t的值,可把该项目归并到具体的那个仪器种类里面。于本申请中,考虑到项目评审过程中,都是项目申报完成后一起进行评审。而这个匹配中,最重要的是把项目分配到合适的组,这关系到后续选择专家,及评审的效率问题。实际上在内部分组中,并不是选择一个仪器项目,而往往有如几十个或上百个仪器项目一同申报。因此,本申请在第一次分组的基础上,采用更准确的凝聚层次聚类的方法来进一步在业务维度角度进行聚类分组。于本实施例中,在各仪器项目基于种类分组完成后,对已分组的各种类组内的全部仪器项目,按照各业务维度的全量内容采用凝聚层次聚类法进行相似性聚类,即依据业务维度的指标找到同一种类下多组相似的项目,以在各种类分组下面得到一或多个待评审项目分组。例如,仪器项目共申报了40个,通过所述指标库对申报的若干个仪器项目按仪器种类进行分组,将这40个项目分配到了3个种类下的组,如t1有10个项目,t2有25个项目,t3有5个。然后再对每个组内的各项目采用凝聚层次聚类法进行聚类,以将相似的项目进行聚类。如,t2聚类后分为两个子分组,t2-1:包括11个项目,t2-2包括14个项目。步骤s103:汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词。于本申请一实施例中,所述步骤s103具体包括:a、将各待评审项目分组的组内所有内容信息按各业务维度分别进行汇总;b、对各待评审项目分组所汇总的内容信息进行智能分词,并统计每个词语出现的次数;c、选择出现次数较多的多个词语以作为各待评审项目分组的匹配词。举例来说,将各待评审项目分组的组内所有内容信息在13个业务维度进行汇总,然后进行智能分词,例如,通过标点符号或语义、字词的属性等进行分词,分别选择重复出现率次数的词语,例如出现频率在前20%的词语,或者,选取一定数量的词语,如选取不足5个关词,补足到5个,从而作为各待评审项目分组的匹配词。步骤s104:依据匹配词从评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。于本申请一实施例中,所述依据匹配词在评审专家库中为各待评审项目分组匹配多位评审专家,包括:a、将各待评审项目分组对应的匹配词与评审专家库中各评审专家对应的专家信息进行比对,并利用bm25算法计算相关性,以分别初步确定多位专家。举例来说,评审专家库可以是根据科技系统的评审专家库为基础,构建的一个包括熟悉行业,主要论文,专利等相关信息专家库。将各待评审项目分组对应的匹配词和专家的信息进行比对,利用bm25算法,计算每个子类和每位专家的相关性,bm25算法是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法。例如,取分组前n位形成初步的候选专家组。b、依据专家信息对初步确定的各位专家采用相关性回避算法进行筛选以得到最终的专家分组。优选地,根据初步确定的n位专家人选,可采用人才库信息,进行专利、论文、工作单位经历、以及最近合作的单位和人员等信息,对需要回避的专家,进行回避排查,最终把剩下的专家,按照评审的要求,随机选取m为专家。例如,一般是3~5位专家,包括一位财务专家。最终输出待评审项目分组,专家分组及待评审项目分组和专家组的匹配关系。综上所述,本申请一方面将全部申报的仪器项目进行了精细的聚类待评审项目分组,并且针对各聚类后的待评审项目分组针对性的匹配专家组,能够减少评审专家的数量,实现更少的专家评审更多的项目,大大提高了项目评审匹配专家的效率,还可以高效的排查出需要回避的专家,进行自动回避筛选。另外,本申请所述方法替代了人工阅读项目申报书,人工分类的方法。如图3所示,展示为本申请于一实施例中的仪器项目申报评审专家匹配装置的模块示意图。如图所示,所述装置300包括:指标库模块301,用于构建划分有多种仪器种类、及多种业务维度的指标库;分组模块302,用于依据所述指标库对申报的若干个仪器项目按仪器种类进行分种类组,并对各种类分组内的全部仪器项目按业务维度进行聚类,以在各组内得到一或多个待评审项目分组;匹配词模块303,用于汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词;专家匹配模块304,用于依据匹配词在评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本申请所述方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。还需要说明的是,应理解以上装置300的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些单元可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,匹配词模块303可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上匹配词模块303的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(applicationspecificintegratedcircuit,简称asic),或,一个或多个微处理器(digitalsignalprocessor,简称dsp),或,一个或者多个现场可编程门阵列(fieldprogrammablegatearray,简称fpga)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessingunit,简称cpu)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称soc)的形式实现。如图4所示,展示为本申请于一实施例中的计算机设备的结构示意图。如图所示,所述计算机设备400包括:存储器401、及处理器402;所述存储器401用于存储计算机指令;所述处理器402运行计算机指令实现如图1所述的方法。在一些实施例中,所述计算机设备400中的所述存储器401的数量均可以是一或多个,所述处理器402的数量均可以是一或多个,而图4中均以一个为例。于本申请一实施例中,所述计算机设备400中的处理器402会按照如图1所述的步骤,将一个或多个以应用程序的进程对应的指令加载到存储器401中,并由处理器402来运行存储在存储器401中的应用程序,从而实现如图1所述的方法。所述存储器401可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。所述存储器401存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。所述处理器402可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。在一些具体的应用中,所述计算机设备400的各个组件通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清除说明起见,在图4中将各种总线都成为总线系统。于本申请的一实施例中,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图1所述的方法。在任何可能的技术细节结合层面,本申请可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本申请的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。这里所描述的计算机可读程序可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。用于执行本申请操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c 等,以及过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本申请的各个方面。综上所述,本申请提供的一种仪器项目申报评审专家匹配方法、装置、设备和介质,通过构建划分有多种仪器种类、及多种业务维度的指标库;依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,并对各种类分组内的全部仪器项目按业务维度进行相似性聚类,以在各组内得到一或多个待评审项目分组;汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词;依据匹配词从评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属
技术领域:
中包含通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。当前第1页1 2 3 
技术特征:1.一种仪器项目申报评审专家匹配方法,其特征在于,所述方法包括:
构建划分有多种仪器种类、及多种业务维度的指标库;
依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,并对各种类分组内的全部仪器项目按业务维度进行相似性聚类,以在各组内得到一或多个待评审项目分组;
汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词;
依据匹配词从评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。
2.根据权利要求1所述的方法,其特征在于,所述指标库中针对各仪器种类分别构建不同层次结构关系的语义字典;和/或,针对各业务维度分别设置不同权重值。
3.根据权利要求2所述的方法,其特征在于,所述依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,包括:
将各仪器项目的项目内容分别利用各仪器种类对应的语义字典,以计算对应至不同业务维度的相关度分数;其中,依据两词语在语义字典中的公共祖先结点具有的最大信息量来计算两词语的相关度;
分别将对应各业务维度的相关度分数与权重值相乘,以计算对应不同仪器种类的总分数;
将总分数为最大的仪器种类作为各仪器项目对应的仪器种类,以供对各仪器项目按仪器种类进行种类分组。
4.根据权利要求1所述的方法,其特征在于,所述汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词,包括:
将各待评审项目分组的组内所有内容信息按各业务维度分别进行汇总;
对各待评审项目分组所汇总的内容信息进行智能分词,并统计每个词语出现的次数;
选择出现次数较多的多个词语以作为各待评审项目分组的匹配词。
5.根据权利要求1至4中任意一所述的方法,其特征在于,所述仪器种类包括:分析仪器、物理性能测试仪器、计量仪器、电子测量仪器、海洋仪器、地球探测仪器、大气探测仪器、天文仪器、医学诊断仪器、核仪器、特种检测仪器、工艺试验设备、计算机及其配套设备、激光器、及其他仪器中任意一种或多种组合。
6.根据权利要求1至4中任意一所述的方法,其特征在于,所述业务维度包括:涉及的领域、单位科研水平、购买的必要性、设备的紧急性、设备的技术指标、设备性能配置、设备的先进性、设备的适应性、使用用途、可应用领域、国内设备使用情况、单位科研队伍、及设备运维技术队伍中任意一种或多种组合。
7.根据权利要求1所述的方法,其特征在于,所述依据匹配词在评审专家库中为各待评审项目分组匹配多位评审专家,包括:
将各待评审项目分组对应的匹配词与评审专家库中各评审专家对应的专家信息进行比对,并利用bm25算法计算相关性,以分别初步确定多位专家;
依据专家信息对初步确定的各位专家采用相关性回避算法进行筛选以得到最终的专家分组。
8.一种仪器项目申报评审专家匹配装置,其特征在于,所述装置包括:
指标库模块,用于构建划分有多种仪器种类、及多种业务维度的指标库;
分组模块,用于依据所述指标库对申报的若干个仪器项目按仪器种类进行种类分组,并对各种类分组内的全部仪器项目按业务维度进行聚类,以在各组内得到一或多个待评审项目分组;
匹配词模块,用于汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词,以作为各待评审项目分组的匹配词;
专家匹配模块,用于依据匹配词在评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。
9.一种计算机设备,其特征在于,所述设备包括:存储器、及处理器;所述存储器用于存储计算机指令;所述处理器运行计算机指令实现如权利要求1至7中任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机指令,所述计算机指令被运行时执行如权利要求1至7中任一项所述的方法。
技术总结本申请提供的一种仪器项目申报评审专家匹配方法、装置、设备和介质,通过构建划分有多种仪器种类、及多种业务维度的指标库;依据指标库对申报的若干个仪器项目按仪器种类进行种类分组,并对各种类分组内的全部仪器项目按业务维度进行相似性聚类,以在各组内得到一或多个待评审项目分组;汇总各待评审项目分组内分别对应各业务维度的内容信息中的一或多个高频词作为匹配词;依据匹配词从评审专家库中为各待评审项目分组匹配多位评审专家,以得到多个分别与各待评审项目分组具有匹配关系的专家分组。本申请替代了人工阅读项目申报书,人工分类的方法,能够提高了项目评审匹配专家的效率,还可以高效的排查出需要回避的专家,进行自动回避筛选。
技术研发人员:易勇;潘永春;杨磊;潘梦凡;朱悦;陆琪融;周慧敏;姜楠;王赟
受保护的技术使用者:上海市研发公共服务平台管理中心
技术研发日:2020.12.07
技术公布日:2021.03.12