用户性格判定方法、装置、存储器和电子设备与流程

    专利2022-07-08  107


    本发明涉及计算机技术领域,尤其涉及一种用户性格判定方法、装置、存储器和电子设备。



    背景技术:

    目前,人工智能技术广泛地应用于人才的发现和推荐中。例如对于运营学者数据的招聘系统,不仅需要利用人工智能技术分析学者的学术成就,还需要了解学者的性格情况。用户在社交平台发布的内容能够反映用户的性格特征,通常利用文本分类的方式进行性格预测,可以训练k个二分类器或者训练输出维度为k的多标签分类器,虽然二者方法不同,但是能够实现同样的功能。前一种方法大多采用支持向量机、贝叶斯等机器学习方法对社交动态进行分类,后一种方法大多采用循环神经网络对文本进行特征编码。但这两种方法都有其缺点,利用机器学习训练的分类器可扩展性低于深度神经网络,采用循环神经网络训练的分类模型实时计算效率太低,没办法达到工业级算法要求。



    技术实现要素:

    鉴于以上缺点,本发明提供了一种基于膨胀门卷积神经网络和注意力机制的用户社交性格判定方法,能够高效、准确地处理多源的社交数据。

    本发明的第一方面涉及一种用户性格判定方法,包括:

    获取目标用户在社交网络中的发文数据并将其转换为文本向量;

    将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;

    基于所述性格分类概率判定所述用户的性格类型。

    进一步地,所述获取目标用户在社交网络中的发文数据并将其转换为文本向量包括:

    对所述发文数据进行预处理;

    采用预训练的词向量模型对预处理后的发文数据进行向量化,得到所述文本向量。

    进一步地,所述将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率包括:

    将所述文本向量输入多个膨胀门卷积神经网络,得到多个输出向量;

    拼接所述多个输出向量得到拼接向量;

    利用注意力网络为所述拼接向量进行打分;

    将打分的拼接向量输入全连接神经网络编码并进行非线性化处理;

    将非线性化处理后的编码输入分类网络得到所述多个维度的性格分类概率。

    进一步地,所述多个膨胀门卷积神经网络包括大小不同的过滤器。

    进一步地,每个维度包括多种状态,每种状态对应一种性格类型。

    进一步地,所述维度为4,每个维度包括2种状态,性格分类概率小于预设阈值为第一状态,对应第一性格类型,大于或等于预设阈值为第二状态,对应第二性格类型。

    本发明的第二方面涉及一种用户性格判定装置,包括:

    获取模块,用于获取目标用户在社交网络中的发文数据并将其转换为文本向量;

    性格分类模型模块,用于接收所述文本向量输入,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;

    判定模块,用于基于所述性格分类概率判定所述用户的性格类型。

    进一步地,所述性格分类模型模块包括:

    输入层,用于获取目标用户在社交网络中的发文数据转换得到的文本向量;

    膨胀门卷积神经网络,用于处理所述文本向量得到多个输出向量;

    拼接层,用于拼接所述多个输出向量得到拼接向量;

    注意力网络,用于为所述拼接向量进行打分;

    全连接层,用于对所述打分的拼接向量编码并进行非线性化处理;

    分类网络,用于根据非线性化处理后的编码得到多个维度的性格分类概率。

    本发明的第三方面涉及一种存储介质,存储有多条计算机可读指令,所述计算机可读指令用于实现如本发明的第一方面所述的方法。

    本发明的第四方面涉及一种电子设备,包括处理器和与所述处理器连接的存储介质,所述存储介质存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如本发明的第一方面所述的方法。

    本发明提出的方法利用了基于膨胀门卷积神经网络和注意力机制的算法模型,通过引入卷积神经网络到用户性格的判定,并且综合利用了注意力机制、门结构以及n-gram特征,兼具高效性和鲁棒性,解决了算法模型训练/预测速度问题以及长文本预测的准确性问题;同时由于采用不同大小的过滤器提取句子中的关键信息,从而能够更好的捕捉局部n-gram特征。

    附图说明

    图1为本发明实施例的用户性格判定方法的流程示意图;

    图2为本发明实施例的用户性格判定装置的结构示意图;

    图3为本发明实施例的性格分类模型的结构示意图;

    图4为本发明实施例的性格分类模型的工作流程的示意图;

    图5为本发明实施例的计算机设备内部的结构示意图。

    具体实施方式

    为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。

    本发明提供的方法可以在如下的终端环境中实施,该终端可以包括一个或多个如下部件:处理器、存储器和显示屏。其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现下述实施例所述的方法。

    处理器可以包括一个或者多个处理核心。处理器利用各种接口和线路连接整个终端内的各个部分,通过运行或执行存储在存储器内的指令、程序、代码集或指令集,以及调用存储在存储器内的数据,执行终端的各种功能和处理数据。

    存储器可以包括随机存储器(randomaccessmemory,ram),也可以包括只读存储器(read-onlymemory,rom)。存储器可用于存储指令、程序、代码、代码集或指令。

    显示屏用于显示各个应用程序的用户界面。

    除此之外,本领域技术人员可以理解,上述终端的结构并不构成对终端的限定,终端可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端中还包括射频电路、输入单元、传感器、音频电路、电源等部件,在此不再赘述。

    实施例一

    如图1所示,本发明实施例提供了一种用户性格判定方法,包括:

    s101、获取目标用户在社交网络中的发文数据并将其转换为文本向量;

    其中,所述用户可选地为使用学者。

    可选地,在获取所述发文数据后,对所述发文数据进行预处理,采用预训练的词向量模型对预处理后的发文数据进行向量化,得到所述文本向量。

    所述预处理主要包括分词、去停用词以及去除噪音等操作。由于社交发文数据是一个异常庞大、充满噪音的文本数据,前期的数据预处理对于后期算法模型训练、性格判定影响很大。通常需去除文本数据中的表情符号、话题内容、@用户操作等对于模型没有意义的噪音数据,然后选择用户发布的预设数量的(例如前20篇)原创社交发文,并将其进行文本拼接。然后采用预训练词向量的方式进行文本的向量化,可选地采用word2vec算法,最终得到词汇向量化表示的文本向量。

    s102、将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;

    所示膨胀门卷积神经网络包括膨胀卷积结构、门结构和残差结构。膨胀卷积神经网络是一种在传统的卷积神经网络里注入空洞,以此增加感受野,使得单个神经元能够捕捉更长的信息。基于卷积神经网络的门结构如下:假设输入序列为x=[x1,x2,...,xn],那么可以给普通的一维卷积加个门:

    y=conv1d1(x)×σconv1d2(x))

    这里两个conv1d的参数(例如卷积核数量、窗口大小等)都一样,但是权值是不共享的,这样卷积部分的参数就翻倍了。其中一个使用sigmoid函数(上式中使用σ符号表示)激活作为“阀门”用来控制流量,另外一个使用恒等函数激活,最后将他们进行逐位相乘。同时为了解决深度网络带来的梯度弥散或梯度爆炸问题,在模型中使用残差结构,残差结构相当于在训练过程中强制补充原始输入信息。

    y=x conv1d1(x)×σ(conv1d2(x))

    其中,所述性格分类模型可选地还包括全连接层和分类网络。

    该步骤具体包括:

    将所述文本向量输入多个膨胀门卷积神经网络,得到多个输出向量;可选地,所述多个膨胀门卷积神经网络包括大小不同的过滤器;

    拼接所述多个输出向量得到拼接向量;

    利用注意力网络为所述拼接向量进行打分;

    将打分的拼接向量输入全连接神经网络编码并进行非线性化处理;

    将非线性化处理后的编码输入分类网络得到所述多个维度的性格分类概率。其中,每个维度包括多种状态,每种状态对应一种性格类型,根据该性格分类概率即可确定该维度的性格类型。例如,每个维度包括两个状态,性格分类概率小于0.5为第一状态(即a性格),大于或等于0.5为第二状态(即b性格)。

    s103、基于所述性格分类概率判定所述用户的性格类型。

    可选地,所述维度为4,每个维度包括2种状态,这样4个维度组合可对应mbti职业性格中的16种性格类型。通过每个维度的性格分类概率,组合即可得到该目标用户的mbti职业性格类型。

    所示性格分类模型基于训练集预先训练得到。所述训练集包括训练用户的社交发文数据和通过例如mbti职业性格测试得到的性格类型。在用于模型训练之前对其中的社交发文数据进行清洗和向量化处理。

    该实施例的方法利用了基于膨胀门卷积神经网络和注意力机制的算法模型,兼具高效性和鲁棒性,解决了算法模型训练/预测速度问题以及长文本预测的准确性问题;同时由于采用不同大小的过滤器提取句子中的关键信息,从而能够更好的捕捉局部n-gram特征。

    实施例二

    如图2所示,本发明还包括和前述方法流程完全对应一致的功能模块架构,即本发明实施例还提供了一种用户性格判定装置,包括:

    获取模块21,用于获取目标用户在社交网络中的发文数据并将其转换为文本向量;

    其中,所述用户可选地为学者。

    可选地,在获取所述发文数据后,对所述发文数据进行预处理,采用预训练的词向量模型对预处理后的发文数据进行向量化,得到所述文本向量。

    性格分类模型模块22,用于接收所述文本向量输入,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;

    判定模块23,用于基于所述性格分类概率判定所述用户的性格类型。

    进一步地,所述性格分类模型模块22如图3所示,包括:

    输入层221,用于获取目标用户在社交网络中的发文数据转换得到的文本向量;

    膨胀门卷积神经网络222,用于处理所述文本向量得到多个输出向量;所述多个膨胀门卷积神经网络为多个,包括大小不同的过滤器;

    拼接层223,用于拼接所述多个输出向量得到拼接向量;

    注意力网络224,用于为所述拼接向量进行打分;

    全连接层225,用于对所述打分的拼接向量编码并进行非线性化处理;

    分类网络226,用于根据非线性化处理后的编码得到多个维度的性格分类概率。其中,每个维度包括多种状态,每种状态对应一种性格类型,根据该性格分类概率即可确定该维度的性格类型。

    可选地,所述维度为4,每个维度包括2种状态,这样4个维度组合可对应mbti职业性格中的16种性格类型。通过每个维度的性格分类概率,组合即可得到该目标用户的mbti职业性格类型。

    该装置各模块的具体功能可参见实施例一中对方法步骤的描述,在此不再赘述。

    该实施例的装置利用了基于膨胀门卷积神经网络和注意力机制的模型,兼具高效性和鲁棒性,能够很好的处理大量长文本数据,并且能够很好的屏蔽文本数据中的噪音信息,解决了算法模型训练/预测速度问题以及长文本预测的准确性问题;同时由于采用不同大小的过滤器提取句子中的关键信息,从而能够更好的捕捉局部n-gram特征。

    实施例三

    如图4所示,结合学者性格判定的具体应用示例说明性格分类模型的工作流程。

    首先获取学者的20条代表性的社交网络发文,对其进行字符串拼接、分词等预处理。例如输入[“kdd历年最佳论文汇总,对比一下最佳论文和高引论文关系”,“neurips历年最佳论文汇总”,“赞!牛人来了,大家加油”,...],首先进行字符串拼接得到“kdd历年最佳论文汇总,对比一下最佳论文和高引论文关系。neurips历年最佳论文汇总。赞!牛人来了,大家加油...”,分词后为[“kdd”,“历年”,“最佳论文”,“,”,“汇总”,“,”,“对比一下”,“最佳论文”,“和”,“高引论文”,“关系”,“。”,“neurips”,“历年”,“最佳论文”,“汇总”,“。”,“赞”,“!”,“牛人”,“来了”,“,”,“大家”,“加油”,...],然后利用word2vec预训练词向量通过查词典的方式将词语映射成固定维度的文本向量。

    性格分类模型的输入层接收文本向量,利用三种不同大小过滤器的膨胀门卷积神经网络对输入的文本向量进行编码分别得到向量a、b、c,拼接三个卷积层输出的向量得到[a;b;c],并利用注意力网络对拼接之后的向量进行打分,对a,b,c三个向量的每个维度进行加权得到向量d,然后再经过一层全连接神经网络编码并使用tanh激活函数进行非线性化处理。

    最后再经过一个使用sigmoid激活的分类网络,最终得到输出维度为4的性格分类概率。其中每一个维度的每一种状态分别代表一种性格。

    例如维度为4的mbti性格分类概率为[0.333,0.452,0.761,0.212],维度1的两个性格类型为内向型(i)和外向型(e),以0.5为阈值,0.333小于0.5,表示内向型(i),类似地,0.452表示直觉型(n),0.761表示思维型(t),0.212表示判断型(j)。根据该4个维度的性格分类概率,可以判定该学者的mbti人格类型为intj。

    如图5所示,本发明可提供一种计算机设备,该计算机设备包括存储介质和处理器。存储介质中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行本发明任一实施例中的性格判定方法的步骤。

    本发明还能够提供一种计算机存储介质,该计算机存储介质上存储有计算机可读指令,计算机可读指令被处理器执行时实现本发明任一实施例中的性格判定方法的步骤。

    在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读存储介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram,randomaccessmemory),只读存储器(rom,read-onlymemory),可擦除可编辑只读存储器(eprom,erasableprogrammableread-onlymemory,或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom,compactdiscread-onlymemory)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

    应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga,programmablegatearray),现场可编程门阵列(fpga,fieldprogrammablegatearray)等。

    在本说明书的描述中,参考术语“本实施例”、“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

    此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

    以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明实质内容上所作的任何修改、等同替换和简单改进等,均应包含在本发明的保护范围之内。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。


    技术特征:

    1.一种用户性格判定方法,其特征在于,包括:

    获取目标用户在社交网络中的发文数据并将其转换为文本向量;

    将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;

    基于所述性格分类概率判定所述用户的性格类型。

    2.根据权利要求1所述的方法,其特征在于,所述获取目标用户在社交网络中的发文数据并将其转换为文本向量包括:

    对所述发文数据进行预处理;

    采用预训练的词向量模型对预处理后的发文数据进行向量化,得到所述文本向量。

    3.根据权利要求2所述的方法,其特征在于,所述将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率包括:

    将所述文本向量输入多个膨胀门卷积神经网络,得到多个输出向量;

    拼接所述多个输出向量得到拼接向量;

    利用注意力网络为所述拼接向量进行打分;

    将打分的拼接向量输入全连接神经网络编码并进行非线性化处理;

    将非线性化处理后的编码输入分类网络得到所述多个维度的性格分类概率。

    4.根据权利要求3所述的方法,其特征在于,所述多个膨胀门卷积神经网络包括大小不同的过滤器。

    5.根据权利要求4所述的方法,其特征在于,每个维度包括多种状态,每种状态对应一种性格类型。

    6.根据权利要求5所述的方法,其特征在于,所述维度为4,每个维度包括2种状态,性格分类概率小于预设阈值为第一状态,对应第一性格类型,大于或等于预设阈值为第二状态,对应第二性格类型。

    7.一种用户性格判定装置,其特征在于,包括:

    获取模块,用于获取目标用户在社交网络中的发文数据并将其转换为文本向量;

    性格分类模型模块,用于接收所述文本向量输入,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;

    判定模块,用于基于所述性格分类概率判定所述用户的性格类型。

    8.根据权利要求7所述的装置,其特征在于,所述性格分类模型模块包括:

    输入层,用于获取目标用户在社交网络中的发文数据转换得到的文本向量;

    膨胀门卷积神经网络,用于处理所述文本向量得到多个输出向量;

    拼接层,用于拼接所述多个输出向量得到拼接向量;

    注意力网络,用于为所述拼接向量进行打分;

    全连接层,用于对所述打分的拼接向量编码并进行非线性化处理;

    分类网络,用于根据非线性化处理后的编码得到多个维度的性格分类概率。

    9.一种存储介质,其特征在于,存储有多条计算机可读指令,所述计算机可读指令用于实现如权利要求1-6任一项所述的方法。

    10.一种电子设备,其特征在于,包括处理器和与所述处理器连接的存储介质,所述存储介质存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如权利要求1-6任一项所述的方法。

    技术总结
    本发明公开了一种用户性格判定方法、装置、存储介质和电子设备。方法包括:获取目标用户在社交网络中的发文数据并将其转换为文本向量;将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;基于所述性格分类概率判定所述用户的性格类型。本发明兼具高效性和鲁棒性,解决了算法模型训练/预测速度问题以及长文本预测的准确性问题。

    技术研发人员:姜鹏;唐杰;刘德兵;张鹏;仇瑜
    受保护的技术使用者:北京智源人工智能研究院
    技术研发日:2020.11.26
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-21636.html

    最新回复(0)