业务控制方法、装置、设备及介质与流程

    专利2022-07-07  126


    本申请涉及人工智能技术领域,尤其涉及图像处理技术,提供了一种业务控制方法、装置、设备及介质。



    背景技术:

    随着图像处理技术的不断发展,逐渐出现了智能求救技术,智能求救技术的主要是:识别实时采集的监控画面,根据监控画面的识别结果,确定该监控画面中的人是否需要帮助。如果该人物需要帮助,则发出报警。

    由于现有的智能求救技术通常是对分别对单帧的监控画面进行检测,检测人在一帧监控画面中的动作。如果该动作与预存的动作匹配,则发出报警。但这样的检测方式仅仅单一时刻的动作进行报警,容易发生误报情况,即目前这种智能求救技术处理业务的准确性较低。



    技术实现要素:

    本申请实施例提供一种业务控制方法、装置、设备及介质,用于提高业务控制的准确性。

    一方面,提供了一种业务控制方法,包括:

    获取包含人体的待处理视频片段;

    识别所述人体的目标部位在所述待处理视频片段中的移动轨迹;

    根据所述移动轨迹,获得与所述移动轨迹相应的移动轨迹图;

    对所述移动轨迹图进行内容识别;

    根据内容识别结果对业务进行控制。

    本申请实施例提供一种业务控制装置,包括:

    获取模块,用于获取包含人体的待处理视频片段;

    轨迹识别模块,用于识别所述人体的目标部位在所述待处理视频片段中的移动轨迹;

    获得模块,用于根据所述移动轨迹,获得与所述移动轨迹相应的移动轨迹图;

    内容识别模块,用于对所述移动轨迹图进行内容识别;

    业务控制模块,用于根据内容识别结果对业务进行控制。

    在一种可能的实施例中,所述轨迹识别模块具体用于:

    针对所述待处理视频片段中的每个视频帧,分别确定所述目标部位的区域;

    根据各个视频帧中所述目标部位的区域变化,确定所述目标部位在所述视频片段中的移动轨迹。

    在一种可能的实施例中,所述轨迹识别模块具体用于:

    针对所述待处理视频片段中多个视频帧,在识别到视频帧中所述目标部位所呈现的动作为预设行为中的第一预设动作时,开始记录视频帧中目标部位的区域的相对位置,直到识别到视频帧中目标部位所呈现的动作为所述预设行为中的第二预设动作时,获得移动轨迹。

    在一种可能的实施例中,视频帧中目标部位的区域的相对位置为所述目标部位中的目标子部位在所述视频帧中的相对位置。

    在一种可能的实施例中,所述目标部位包括所述人体中多个目标部位,所述轨迹识别模块具体用于:

    拼接各个视频帧中所述多个目标部位的区域变化,获得移动轨迹。

    在一种可能的实施例中,所述获得模块具体用于:

    将所述移动轨迹中各个点的位置映射在图像中的相应位置,获得与所述移动轨迹相应的移动轨迹图。

    在一种可能的实施例中,所述装置还包括显示控制模块,所述显示控制模块用于:

    在所述开始记录视频帧中目标部位的相对位置之后,控制显示记录的相对位置;以及,控制显示所述移动轨迹图的内容识别结果。

    在一种可能的实施例中,所述业务控制模块具体用于:

    在所述内容识别结果与预设内容匹配时,生成并控制显示告警信息;所述告警信息用于指示所述人体对应的人当前处于危险状态。

    在一种可能的实施例中,所述待处理视频片段包括从监控摄像头获取的视频流中检测出包括人体的连续多个视频帧;所述告警信息包括所述人体当前所处的位置信息;所述位置信息是通过如下任一方式获得:

    对所述待处理视频片段中的任一视频帧进行内容识别获得的;

    根据所述监控摄像头的位置确定的。

    本申请实施例提供一种计算机设备,包括:

    至少一个处理器,以及

    与所述至少一个处理器通信连接的存储器;

    其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如一方面中任一项所述的方法。

    本申请实施例提供一种存储介质,所述存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如一方面中任一项所述的方法。

    由于本申请实施例采用上述技术方案,至少具有如下技术效果:

    在本申请实施例中,结合各种图像处理技术,确定人体中目标部位在视频片段内的移动轨迹,并将该移动轨迹转换为移动轨迹图,对移动轨迹图进行内容识别,以获得内容识别结果,根据内容识别结果进行业务控制,由于是基于持续时间内部位的移动轨迹的识别结果进行的业务控制,充分地利用了人体的部位细节信息和求助过程中的时序信息,因此可以避免单帧视频帧所引起的误识别的情况,提升了业务控制的准确性。且,由于减少了误处理的情况,自然也就减少了误报警的情况,减轻了工作人员的负担。且,本申请实施例可以应用于对监控场景中进行全方位的实时求救监测,在突发事件的发生时,能够及时准确高效地提供相应救援,并通过自动化监测摄像头的方式监测突发求救,减少了安保人员的工作量,提升了响应速度。

    附图说明

    图1为本申请实施例提供的一种业务控制方法的应用场景示意图;

    图2为本申请实施例提供的一种业务控制方法的流程示意图一;

    图3为本申请实施例提供的待处理视频片段中多个视频帧的示例图;

    图4为本申请实施例提供的一种检测目标部位的过程示例图;

    图5为本申请实施例提供的一种移动轨迹的示例图;

    图6为本申请实施例提供的一种拼接各目标部位的移动轨迹的过程示例图;

    图7为本申请实施例提供的一种对移动轨迹图进行内容识别的过程示例图;

    图8为本申请实施例提供的图1中终端和服务器之间的交互示例图;

    图9为本申请实施例提供的一种业务控制方法的流程示意图二;

    图10为本申请实施例提供的检测手部的过程示例图;

    图11为本申请实施例提供的检测各个手势的示例图;

    图12为本申请实施例提供的对移动轨迹图进行字符识别的过程示例图;

    图13为本申请实施例提供的终端显示告警信息的示例图;

    图14为本申请实施例提供的业务控制装置的结构示例图;

    图15为本申请实施例提供的计算机控制设备的结构示例图。

    具体实施方式

    为了更好的理解本申请实施例提供的技术方案,下面将结合说明书附图以及具体的实施方式进行详细的说明。

    为了便于本领域技术人员更好地理解本申请的技术方案,下面对本申请涉及的名词进行介绍。

    1、人工智能(artificialintelligence,ai):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

    人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

    2、计算机视觉技术(computervision,cv):计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。

    3、人体关键点:是指在检测图像中存在人体,可以检测该人体中关键部位的关键点,这些人体关键点可以描述出人体的形状。在识别人体时,可以采用人体中的21个关键点进行识别,这21个关键点分别分布在头顶、五官、颈部、四肢等主要关节部位。

    4、部分亲和域(partaffinityfield,paf):用于检测人体关键点的一种技术,基本原理是在图像中两个相邻关键点之间,建立一个有向场,比如左手腕和左手肘,将基于场找到的所有的左手腕和左手肘建立一个二分图,基于二分图进行左右匹配,匹配成功确定为同一个人的关节,以此类推,对所有相邻点执行这样的匹配操作,从而获得图像中每个人体的人体关键点。

    5、目标部位:是指人体中特定的身体部位,目标部位可以是人体中某一个特定部位,或者是人体中多个特定部位。目标部位例如头部、手或脚等一种或几种。

    6、部位关键点:是指目标部位所对应的关键点,部位关键点可以表现该目标部位的整体形状。以目标部位是手为例,手通常包括21个关键点,分别分布在各个手指上和手掌上。

    7、目标子部位:是指目标部位中的一部分,该目标子部位可以属于目标部位中部分部位关键点所构成的,例如目标部位为手部,那么目标子部位可以为食指。

    8、移动轨迹:用于表示目标部位在各个视频帧中的区域变化,可以进一步理解为目标部位在视频片段所呈现的位置变化结果。当目标部位为一个时,移动轨迹为该目标部位的移动轨迹。当目标部位包括多个时,该移动轨迹可以为这多个目标部位的移动轨迹的组合结果。移动轨迹的形状与目标部位的运动相关的,因此移动轨迹的形状是不确定的,形状具体例如为某个字符、字符串或者图案等。

    9、移动轨迹图:是指以图像为载体呈现出的移动轨迹,具体可以是将移动轨迹中各个点映射在图像中所形成的结果。移动轨迹图会继承移动轨迹的形状,因此移动轨迹图所呈现的内容是与移动轨迹相对应的。

    10、预设行为:是指设备中预存的用于触发执行业务的行为,预设行为为多个连续动作的集合。预设行为例如为用户用食指写“sos”的行为。第一预设动作和预设第二预设动作属于预设行为中的预设动作,其中第一预设动作可以在预设行为中的时间相对于第二预设动作在预设行为中的时间更靠前,例如第一预设动作为预设行为中的开始动作,第二预设动作为预设行为中的结束动作。第一预设动作和第二预设动作可以相同的动作,也可以是不同的动作,本申请不做具体限制。

    下面对相关技术进行介绍:

    在相关技术中,通常会对监控画面进行单帧实时分析,一旦检测到人在监控画面上进行某个特定的动作,则发出报警。例如人在监控画面中做出双手抱头的动作,则确定该人处于危险状态,进而发出告警。但仅根据单一时刻的监控画面进行分析,产生误告警的可能性较大,即该方式处理业务的准确性低。

    鉴于此,本申请实施例提供一种业务控制方法,下面对本申请实施例中的业务控制方法的设计思想进行介绍。

    本申请实施例中的业务控制方法可以应用于各种监控场景下,例如可以用于检测并识别人在监控摄像头下进行的求助行为,具体例如人在监控摄像头下写出的“sos”,并在检测到人的求助行为后,进行及时响应。本申请实施例可以根据图像处理技术和各种ai视觉算法,ai视觉算法例如人体检测算法、目标部位跟踪和图像识别算法等,实现了对一段视频中人的行为进行检索分析,实时地检测出该监控摄像头下的人是否需要帮助。

    具体而言,本申请实施例中利用人体检测算法持续对监控摄像头的视频流中的人体进行监测。当检测到视频流中存在人体时,对该人体的目标部位进行实时跟踪,并记录在每一视频帧中获取到的目标部位的相对位置,获得该目标部位的移动轨迹。并将该移动轨迹映射为图像,以获得移动轨迹图,对该移动轨迹图进行内容识别,根据获得的内容识别结果进行相应的业务控制。具体例如根据内容识别结果确定该人存在求助行为,则生成告警信息,还可以将告警信息推送给相关人员的终端设备,使得相关人员可以及时前往监控摄像头位置对应的位置,为该人提供救助。

    在上述设计思想的基础上,下面对本申请实施例的业务控制方法的应用场景进行介绍。

    请参照图1,为本申请实施例提供的一种业务控制方法的应用场景图,该应用场景包括监控摄像头110、监控中心120和存储系统130。监控摄像头110和监控中心120之间可以相互通信,监控摄像头110和监控中心120可以分别与存储系统130进行相互通信,通信的方式可以是任意的无线或有线通信,本申请不做具体限制。

    其中,监控摄像头110的类型可以是任意的,例如球机或枪机摄像头等,监控摄像头110可以包括一个或多个摄像头,各个监控摄像头110可以安装在不同场所,例如室内场所或室外场所等,室内场所例如电梯或房间内,室外场所例如公路或公园等。图1中是以两个监控摄像头110为例,实际不限制监控摄像头的数量。监控中心120可以通过具有图像处理能力的设备实现,具有图像处理能力的设备例如终端或服务器,终端具体例如计算机或便携式电脑等。服务器例如实体服务器或云服务器,可以是单个服务器或服务器集群。存储系统130可以泛指具有存储能力的设备,例如云服务器等。

    在第一种可能的场景中,监控中心120可以通过一个或多个终端121实现:

    监控摄像头110用于采集其监控范围内的视频数据,并将视频数据发送给监控中心120。这种情况下监控中心120接收监控摄像头110发送的视频数据,对视频数据进行解码,从而获得视频帧,显示视频帧,以及对视频帧进行处理,确定是否需要进行相应的业务控制,其中涉及的业务控制方法的内容将在下文中进行介绍。

    在第二种可能的场景中,监控中心120通过终端121和服务器122实现:

    监控摄像头110用于采集其监控范围内的视频数据,并将视频数据发送给监控中心120。服务器122从监控摄像头110或从终端121获得视频数据,对视频数据进行解码,从而获得视频帧,将视频帧发送给终端121进行显示,并对视频帧进行处理,确定是否需要进行相应的业务控制,其中涉及的业务控制方法的内容将在下文中进行介绍。进一步地,还可以将业务控制结果及时地发送给终端121,使得终端121能够及时地显示。

    监控摄像头110还可以直接将视频数据发送给存储系统130进行存储。或者,在终端121或服务器122处理之后,确定满足存储条件的视频数据可以发送给存储系统130进行存储,存储系统130获得并存储视频数据。存储条件例如需要进行业务控制的视频数据。

    当然,在具体实施时,监控中心120既可以包括第一种可能的应用场景中的终端121,也可以又包括第二种可能的应用场景中的服务器122和终端121。

    应当说明的是,图1是对本申请实施例涉及的应用场景进行示例,实际并不限制本申请实施例涉及的业务控制方法的应用场景。

    基于上述图1的第一种可能的场景,下面对本申请实施例的业务控制方法进行介绍。该业务控制方法通过图1中的终端121执行,下面结合图2所示的业务控制方法的流程图,对该业务控制方法进行介绍:

    s201,终端121获取包含人体的待处理视频片段。

    如前文论述的内容,由于监控摄像头110的数量可能较多,监控中心120包括的终端121可以有多个,因此在本申请实施例中,一个终端121可以对接固定的一个或多个监控摄像头110,所谓对接可以理解为该终端121用于对对接的监控摄像头110所采集的监控画面进行处理。

    或者,多个终端121中包括一个主终端和多个从终端,该主终端用于监控其它终端的工作状态,并将监控摄像头110的视频数据分配给对应的从终端进行处理,例如主终端可以将监控摄像头110所采集的监控画面分配给处于当前处理量少或者闲置的从终端,这样可以避免某个终端121的处理量过大,以相对均衡各个从终端的业务处理量。

    在监控摄像头110在向终端121发送视频数据之前,监控摄像头110可以检测监控画面中的人体,将包含人体的连续多个监控画面编码成数据流,并将数据流发送给终端121,如此一来,终端121可以获得包含人体的待处理视频片段。在该实施例中,监控摄像头110可以对监控画面进行初步地筛选,减少与终端121之间的数据交互量,以及减少了监控中心120的数据处理量。

    或者,监控摄像头110直接将采集的监控画面编码成视频流,将视频流发送给终端121。终端121接收并对视频流进行解码,从而获得多个视频帧,并对视频帧进行人体检测,一旦检测到人体,对应获得包含该人体的连续多个视频帧,从而相当于获得了待处理视频片段。在本申请实施例中,监控摄像头110无需进行目标检测,减少了监控摄像头110的处理量。

    在监控摄像头110或终端121检测每个视频帧是否包含人体时,可以采用目标检测技术,检测视频帧中是否包括人体,如果视频帧不包括人体,则不对该视频帧进行后续的处理过程。目标检测技术例如yolo或sdd检测技术。

    其中,yolo检测技术采用卷积网络提取特征,并利用全连接层对特征进行预测,以检测视频帧中是否存在人体。sdd(singleshotmultiboxdetector)检测技术,sdd检测技术对视频帧进行多次卷积处理,获得多个特征图,特征映射图包含了视频帧的图像信息,例如视频帧的灰度值、轮廓特征等,并对多个特征图定位和检测视频帧中是否存在人体,以及人体在视频帧中的位置。

    在具体检测视频帧中的人体时,一个视频帧中可能包括多个人中每个人的人体,因此当终端121检测到一个视频帧中包括多个人体时,可以创建与人体的数量相对应的进程,每个进程分别用于处理对应人体的视频片段。在本申请实施例中,终端121可以根据视频帧中需要处理的人体的数量,创建进程,实现对视频片段中不同人体的并行处理,提升处理效率。其中针对每个人体的处理过程均是相同的,下文中是以处理一个人的人体为例,对本申请实施例涉及的业务控制方法进行介绍。

    例如,请参照图3所示的待处理视频片段的多个视频帧,图3中(1)~(n)表示待处理视频片段中的多个视频帧,从图3中(1)~(n)中,可以看到各个视频帧均包含人体300。另外,图3中的箭头表示待处理视频片段的时间轴的先后顺序,即图3中(1)~(n)表示沿时间轴方向从前到后的多个视频帧。

    s202,终端121识别人体的目标部位在待处理视频片段中的移动轨迹。

    在多个视频帧中每个视频帧中,如果该视频帧中存在人体,可以识别出该人体中的目标部位。终端121可以直接利用图像识别从人体的区域中识别出目标部位所对应的区域。为了便于描述人体在视频帧中的区域可以称为人体区域,目标部位在视频帧中的区域可以称为目标部位区域。终端121具体可以提取视频帧中人体关键点,根据人体关键点识别出目标部位的区域。其中人体关键点可以参照前文论述的内容,此处不再赘述。

    例如,终端121可以根据openpose或hrnet技术提取人体关键点。openpose技术对视频帧进行处理,确定视频帧中可能的关节点,根据paf识别出人体。高分辨率人体识别网络(deephigh-resolutionrepresentationlearningnetwork,hrnet),从高分辨率子网络(high-resolutionsubnetwork)作为第一阶段开始,逐步增加高分辨率到低分辨率的子网,形成更多的阶段,并将多分辨率子网并行连接,进行多次多尺度融合,使得每一个高分辨率到低分辨率的表征都从其他并行表示中反复接收信息,从而得到丰富的高分辨率表征,从而获得精度更高的人体关键点。

    终端121获得人体关键点之后,可以根据人体关键点和目标部位在人体的区域范围,识别出目标部位的区域。终端121可以预存有目标部位在人体中的区域范围,根据人体关键点进而确定出该目标部位所对应的区域。例如,继续沿用图3的例子,例如终端121识别图3中(2)所示的人体,从而获得如图4中所示的人体关键点410。

    在识别出视频帧中的目标部位之后,目标部位可能随着时间运动着,因此目标部位在视频帧中的相对位置也会变化,因此终端121可以对多个视频帧的跟踪检测,获得目标部位在待处理片段中的移动轨迹。

    具体地,终端121可以识别每个视频帧中的目标部位的区域的相对位置,记录多个视频帧中区域的相对位置,从而获得目标部位的移动轨迹,该移动轨迹也可以理解为该目标部位的区域的变化,这里区域的变化包括该区域在视频帧中的相对位置的变化。

    在具体实施时,由于目标部位是视频帧中一个相对较大的区域,该目标部位的变化可能不是很明显,因此如果直接识别该区域的移动轨迹,获得的移动轨迹可能不明显,因此在本申请实施例中,可以从该目标部位中确定目标子部位,将目标子部位的区域变化,确定为该目标部位的移动轨迹。目标子部位的内容可以参照前文论述的内容,此处不再赘述。

    例如继续沿用图3~图4的例子,终端121检测到人体关键点之后,检测手部区域,并检测手部区域的部位关键点420。终端121进一步以目标子部位为食指为例,终端121检测到图3中(2)所示的手的姿势为“布”,该姿势为预设行为中的开始姿势,则开始从图3中(2)所示的视频帧开始记录食指的相对位置,一直到检测图3中(n)所示的视频帧的姿势为预设行为中的结束姿势,从而获得手部的移动轨迹。

    在实际监控场景中,由于存在各种人,每个人在监控下可能都会有各种动作,如果终端121对每个人的任意移动轨迹都进行全面检测,终端121的处理量会较大,因此在本申请实施例中,终端121可以对多个视频帧中满足动作条件的视频帧中的目标部位进行跟踪,以获得目标部位对应的移动轨迹。

    具体的,终端121可以识别每个视频帧中目标部位所呈现的动作,当终端121检测到某个视频帧中目标部位的动作为预设行为中的第一预设动作时,则开始记录视频帧中目标部位的区域的相对位置,直到识别到另一视频帧中的目标部位的动作为预设行为中的第二预设动作时,获得该目标部位的移动轨迹。目标部位所呈现的动作可以理解为该视频帧中目标部位所呈现的姿态。

    具体实施时,终端121可以从视频帧中识别目标部位的区域,识别该目标部位的区域可以参照前文论述的内容,此处不再赘述。在获得目标部位的区域之后,终端121可以将该目标部位的区域与预存的各种动作所对应的区域进行匹配,将匹配度最大的动作作为目标部位的区域所对应的动作,从而获得该视频帧中目标部位对应的动作。本申请实施例中的动作又可以称为姿态。

    进一步地,为了保证识别的准确性,终端121可以先识别该目标部位的区域中的各个部位关键点,根据各个部位关键点的分布,从而识别该视频帧中目标部位所对应的动作。

    终端121中预存的预设行为可以是多个。终端121当检测到某个视频帧对应的动作属于任一预设行为中第一预设动作时,开始进行检测,当检测到另一视频帧对应的动作属于该预设行为中第二预设动作时,则停止检测,这样可以减少终端121的处理量,且能够获得更具有针对性的移动轨迹。

    应当说明的是,终端121可以是在检测视频帧中的人体之后,就检测该视频帧中目标部位的动作。或者也可以是在检测完多个视频帧中每个视频帧中的人体之后,再依次检测各个视频帧中的目标部位的动作,本申请不对检测目标部位的动作的时机进行限制。

    当目标部位只有一个,那么终端121直接对该目标部位进行跟踪,获得该目标部位的移动轨迹。在某些情况下,人处于危险状态时,可能前段时间某个身体部位是可以自由活动的,可能后段时间由于不法分子的威胁等,可能导致该人后段时间该身体部位的运动受限,那么该人有可能利用其他部位的运动发出求救信号。因此在本申请实施例中目标部位可能包括多个,这种情况下,终端121可以对每个目标部位进行跟踪,从而获得每个目标部位对应的移动轨迹,可以将多个目标部位的移动轨迹进行拼接,作为移动轨迹。拼接可以理解为按照时间先后顺序拼接各个部位的移动轨迹,可以进一步理解为按照时间的先后顺序,重合各个目标部位的移动轨迹。终端121也可以直接从多个移动轨迹中筛选出一个移动轨迹,例如终端121可以从移动轨迹中筛选出一个内容信息最丰富的移动轨迹,内容信息包括移动轨迹的形状等。

    例如,继续沿用图3的例子,终端121记录从第(2)至第(n)所示的视频帧中手的相对位置,获得如图5所示的移动轨迹。例如,以目标部位包括手和头为例,记录手的移动轨迹如图6中(1)所示的“s”,以头的移动轨迹如图6中(2)所示的“os”,将二者的移动轨迹进行拼接,获得如图6中(3)的轨迹图所示的“sos”。

    应当说明的是,终端121在记录目标部位的位置的过程中,这些实时记录的目标部位的位置相当于实时的移动轨迹,终端121在记录的同时还可以实时地展示记录的目标部位,以便于工作人员实时查看,及早发现监控下人的异常。

    s203,终端121根据移动轨迹,获得与移动轨迹相应的移动轨迹图。

    如前文论述的内容,移动轨迹实际包括目标部位在各个时刻的位置,因此在获得移动轨迹之后,相当于获得了各个点,因此终端121可以将每个点的位置分别映射到图像中的相应位置,这里的图像可以是任意的图像模板,例如图可以是不包含任意图像信息的空白图片,从而获得移动轨迹所对应的移动轨迹图。或者,终端121可以对记录的移动轨迹进行截图,以获得移动轨迹图。

    在具体实施时,终端121可以是在检测完预设行为的移动轨迹之后,将该移动轨迹中各个点进行映射,获得移动轨迹图,或者终端121可以是在记录目标部位的相对位置的同时,就实时地将获得相对位置映射在图像中,在获得移动轨迹时,自然也就获得了移动轨迹图。

    例如,继续沿用图3的例子,终端121将如图5所示的移动轨迹映射到图像中,获得如图7中(1)所示的移动轨迹图,对该移动轨迹图进行识别,获得如7中(1)所示的移动轨迹图进行识别,获得如图7中(2)所示的内容识别结果,具体如图7中(2)所示的“sos”。

    由于人处于危险等各类特殊状态下时,通常无法基于纸张等各类介质进行求助信息的书写,在本申请实施例中,识别人体中目标部位的移动轨迹,巧妙地将该移动轨迹转换为图像,从而捕捉到人在无介质情况下所留下的各类信息,有利于及时且准确地检测出人所想要表达的信息,及时为其提供帮助。

    s204,终端121对移动轨迹图进行内容识别。

    终端121可以对移动轨迹图进行内容识别,从而获得移动轨迹图的内容识别结果。内容具体包括字符、图形、图案等中的一种或多种。终端121可以根据预存的各个内容识别模型,对移动轨迹图进行内容识别,例如终端121可以通过字符识别模型识别移动轨迹图中字符,从而获得识别出的字符。进一步地,终端121在获得内容识别结果之后,可以展示该内容识别结果。

    s205,终端121根据内容识别结果进行业务控制。

    终端121在获得内容识别结果之后,如果根据该内容识别结果,确定该监控下的人处于特定状态,特定状态例如危险状态,具体例如终端121可以将内容识别结果与预存的预设内容进行匹配,如果该内容识别结果与预设内容匹配,终端121确定该人处于危险状态。终端121可以执行相应的业务,例如发起告警,具体例如终端121可以生成并显示告警信息,该告警信息用于指示该人处于危险状态,终端121还可以将告警信息发送给目标人员的终端,以使得该目标人员能够及时进行处理。在向目标人员发送告警信息时,可以通过短信进行发送,或者可以通过其他即时通讯消息进行发送。

    终端121接收告警信息之后,可以显示该告警信息,同时还可以显示内容识别结果。例如终端121可以显示监控画面,并在监控画面中以浮窗的形式显示告警信息和内容识别结果。

    为了便于工作人员能够及时确定该人的位置进行施救,在本申请实施例中,终端121可以定位该监控摄像头110的位置信息,或者可以识别多个视频帧中任一视频帧,从而获得该人所处的位置信息,将该位置信息携带在告警信息中,如此一来,工作人员在获得告警信息之后,就可以直接定位该人的位置信息,以及时地进行施救。

    如果终端121根据内容识别结果,确定该人并不处于危险状态,则可以不执行告警业务,并继续重复上述过程。

    进一步地,当终端121检测到该待处理视频片段对应的内容识别结果与预设内容匹配时,终端121可以将该待处理视频片段发送给存储系统130,使得存储系统130可以存储该待处理视频片段,以留下相应的证据。

    应当说明的是,上述实施例是对处理一段视频进行示例介绍,在实际应用时,终端121需要对包含人体的各个视频片段均进行处理,处理过程均可以参照前文论述的内容,此处不再赘述。

    在图2所示的实施例中,实现了对监控场景下的视频帧进行自动检测和自动报警,减少了工作人员的工作量,且由于本申请实施例中是结合人的目标部位在多个连续的视频帧中每个视频帧中的动作,以及目标部位的移动轨迹,进而确定该监控场景下该人是否需要帮助,进而执行相应的业务,提高了业务控制的准确性。且,本申请实施例中突破了常规认知中通常所认为的识别动作来判断人是否需要求助这一认知,本申请实施例中结合视频帧中的动作以及人通过目标部位的移动轨迹所透露的求助信号来执行相应的业务,提升业务控制的准确性,减少误报的可能性。

    下面基于图1中的第二种可能的应用场景,对本申请实施例涉及的业务控制方法进行介绍,请参照图8所示的交互示意图,该交互过程具体包括:

    s801,服务器122从监控摄像头110获取待处理视频片段。

    获取待处理视频片段的方式可以参照前文论述的内容,此处不再赘述。本申请实施例中是以从监控摄像头110获得待处理片段为例,实际上服务器122也可以从终端121获得待处理视频片段。

    s802,服务器122识别人体的目标部位在待处理视频片段中的移动轨迹。

    获得移动轨迹的方式可以参照前文论述的内容,此处不再赘述。

    s803,服务器122将记录的移动轨迹发送给终端121。

    s804,终端121显示记录的移动轨迹。

    s805,服务器122根据移动轨迹,获得与移动轨迹相应的移动轨迹图。

    获得移动轨迹图的方式可以参照前文论述的内容,此处不再赘述。

    s806,服务器122对移动轨迹图进行内容识别。

    进行内容识别的方式可以参照前文论述的内容,此处不再赘述。

    s807,服务器122将内容识别结果发送给终端121。

    s808,终端121显示内容识别结果。

    s809,服务器122根据内容识别结果生成告警信息。

    s810,服务器122将告警信息发送给终端121。

    s811,终端121显示告警信息。

    其中,s803~s804为可选的部分,s807~s808为可选的部分,以及s810~s811为可选的部分。

    图8中的服务器122还可以用于实现图2中终端121所执行的任一业务控制方法,此处不再一一赘述。

    在图8所示的实施例中,服务器122同样结合了人体中目标部位在连续多帧中的移动轨迹来控制业务执行,提升了业务控制的准确性。且,由服务器122进行视频帧处理和业务控制,终端121只需进行相应的显示即可,可以相对减少终端121的处理量,二者协同处理,以提高业务控制的效率。

    为了更清楚地说明本申请实施例中的业务控制方法,下面以目标部位为手为例,结合图9所示的业务控制方法的流程图进行介绍:

    s901,服务器122获取待处理视频片段,并检测视频帧中的手势。

    服务器122接收视频流,并对视频流进行解帧后得到多个视频帧。服务器122对每个视频帧进行人体检测,并对检测到的人体持续且实时地进行手部定位以及手势识别。

    例如,服务器122获得如图10中(1)的视频帧中的人体,人体的局部放大图如图10中(2)所示,进而检测到如图10中(3)中所示的人体关键点,该人体关键点具体可以参照图10中(4)所示的局部放大图,服务器122进而根据人体关键点,获得如图10中(5)所示的手部区域,该手部区域的局部放大图可以参照图10中(6)所示。

    服务器122具体可以根据人体手腕和手肘位置的关键点坐标,定位得到手部区域,手部区域的边界框计算公式示例如下:

    xhand=xwrist,yhand=ywrist

    其中,x为某一人体关键点的横坐标,而y为人体关键点的纵坐标,xhand为手部边界框的中心位置的横坐标,yhand为手部边界框的中心位置的纵坐标,whand为手部边界框的宽,hhand为手部边界框的高。xelbow表示手肘关键点的横坐标,yelbow表示手肘关键点的纵坐标,xwrist表示手腕关键点的横坐标,ywrist表示手腕关键点的纵坐标。

    在定位出手部区域之后,识别手部的部位关键点,例如采用可以openpose等算法获取手部区域的部位关键点位置,并根据各个部位关键点的位置排列和夹角之间的关系识别手势。

    举例来说,手部的部位关键点分布可以参照图11中(1)所示,服务器122确定五指全部伸直时,则确定手势为如图11中(2)所示的“布”;服务器122确定五根指头的关键点们分别可以排列成为直线,且相邻直线之间的角度小于45度,则确定手部的姿势为拳头,具体如图11中(3)所示;服务器122识别部位关键点1、5、6、7,8大致排列在一条直线,且其余四指存在弯曲时,可将手势识别为食指伸出的状态,具体如图11中(4)所示。

    s902,服务器122检测到开始动作之后,进行手势跟踪。

    服务器122一旦检测到预先设定好的开始手势出现,开始手势例如“布”,“v”或“ok”,在之后的每一视频帧中做出手势的手进行部位关键点检测,具体例如对如食指尖,手掌心等特定位置的跟踪。

    s903,服务器122检测到结束动作之后,获得手部的移动轨迹图。

    例如,服务器122将手势“布”设定为开始手势和结束手势,服务器122当检测到手势“布”出现时,开始记录手部的相对位置,直至下一个手势“布”出现,获得手部的移动轨迹,进而将手部的移动轨迹映射在图像中,从而获得移动轨迹图。在此过程中,本申请实施例中可以记录食指指尖的移动轨迹,作为手部的移动轨迹,由于人是采用食指指尖进行书写,因此可以提高检测到的移动轨迹的清晰程度。

    s904,服务器122对移动轨迹图进行字符识别,获得字符识别结果。

    服务器122进行字符识别可以利用字符识别模型或者光学字符识别(opticalcharacterrecognition,ocr)技术进行识别,字符识别模型可以采用各类网络神经模型。

    例如,请参照图12,为本申请实施例提供的一种识别字符的过程示例图,服务器122获得的手部的移动轨迹图如图12中(1)所示,将该移动轨迹图输入至如图12中(2)所示的神经网络,从而获得如图12中(3)所示的字符识别结果,具体为“sos”。

    s905,服务器122若字符识别结果与预设字符匹配,则生成告警信息。

    当服务器122检测该字符识别结果与预设字符相互匹配,生成告警信息。该告警信息中也可以携带有该人所在的位置信息,获得位置信息的方式可以参照前文论述的内容,此处不再赘述。进一步地,服务器122在生成告警信息之后,可以将告警信息发送给终端121,使得终端121可以显示如图13所示的界面图,该界面中包括告警信息所示的“告警!!!”以及字符识别结果,字符识别结果即如图13所示的“sos”。

    在图9所示的实施例中,服务器122可以基于手部在多个视频帧中的移动轨迹,控制业务执行,由于人通常是利用手部进行书写,因此在图9中所示的实施例中,检测手部的移动轨迹,更有可能检测到该人在特殊情况下所留下的求助信号,以及时地为需要的人提供帮助。

    基于同一发明构思,本申请实施例提供一种业务控制装置,该装置可以用于实现前文论述的终端121或服务器122的功能,请参照图14,该装置包括:

    获取模块1401,用于获取包含人体的待处理视频片段;

    轨迹识别模块1402,用于识别人体的目标部位在待处理视频片段中的移动轨迹;

    获得模块1403,用于根据移动轨迹,获得与移动轨迹相应的移动轨迹图;

    内容识别模块1404,用于对移动轨迹图进行内容识别;

    业务控制模块1405,用于根据内容识别结果对业务进行控制。

    在一种可能的实施例中,轨迹识别模块1402具体用于:

    针对待处理视频片段中的每个视频帧,分别确定目标部位的区域;

    根据各个视频帧中目标部位的区域变化,确定目标部位在视频片段中的移动轨迹。

    在一种可能的实施例中,轨迹识别模块1402具体用于:

    针对待处理视频片段中多个视频帧,在识别到视频帧中目标部位所呈现的动作为预设行为中的第一预设动作时,开始记录视频帧中目标部位的区域的相对位置,直到识别到视频帧中目标部位所呈现的动作为预设行为中的第二预设动作时,获得移动轨迹。

    在一种可能的实施例中,视频帧中目标部位的区域的相对位置为目标部位中的目标子部位在视频帧中的相对位置。

    在一种可能的实施例中,目标部位包括人体中多个目标部位,轨迹识别模块1402具体用于:

    拼接各个视频帧中多个目标部位的区域变化,获得移动轨迹。

    在一种可能的实施例中,获得模块1403具体用于:

    将移动轨迹中各个点的位置映射在图像中的相应位置,获得与移动轨迹相应的移动轨迹图。

    在一种可能的实施例中,装置还包括显示控制模块1406,显示控制模块1406用于:

    在开始记录视频帧中目标部位的相对位置之后,控制显示记录的相对位置;以及,控制显示移动轨迹图的内容识别结果。

    在一种可能的实施例中,业务控制模块1405具体用于:

    在内容识别结果与预设内容匹配时,生成并控制显示告警信息;告警信息用于指示人体对应的人当前处于危险状态。

    在一种可能的实施例中,待处理视频片段包括从监控摄像头获取的视频流中检测出包括人体的连续多个视频帧;告警信息包括人体当前所处的位置信息;位置信息是通过如下任一方式获得:

    对待处理视频片段中的任一视频帧进行内容识别获得的;

    根据监控摄像头的位置确定的。

    图14中装置还可以用于执行前文论述的任一业务控制方法,此处不再赘述。

    基于同一发明构思,本申请实施例提供一种计算机设备,请参照图15,该计算机设备包括处理器1501和存储器1502。

    处理器1501可以是一个中央处理单元(centralprocessingunit,cpu),或者为数字处理单元等等。本申请实施例中不限定上述存储器1502和处理器1501之间的具体连接介质。本申请实施例在图15中以存储器1502和处理器1501之间通过总线1503连接,总线1503在图15中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1503可以分为地址总线、数据总线、控制总线等。为便于表示,图15中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

    存储器1502可以是易失性存储器(volatilememory),例如随机存取存储器(random-accessmemory,ram);存储器1502也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flashmemory),硬盘(harddiskdrive,hdd)或固态硬盘(solid-statedrive,ssd)、或者存储器1502是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1502可以是上述存储器的组合。

    处理器1501,用于调用存储器1502中存储的计算机程序时执行前文任一的业务控制方法,还可以用于实现图14所示的装置的功能,或者还可以用于实现前文论述的终端或服务器的功能。

    基于同一发明构思,本申请实施例提供一种存储介质,所述存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行前文任一的业务控制方法。

    本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

    基于同一发明构思,本申请实施例提供一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的业务控制方法。

    本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

    或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

    显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。


    技术特征:

    1.一种业务控制方法,其特征在于,包括:

    获取包含人体的待处理视频片段;

    识别所述人体的目标部位在所述待处理视频片段中的移动轨迹;

    根据所述移动轨迹,获得与所述移动轨迹相应的移动轨迹图;

    对所述移动轨迹图进行内容识别;

    根据内容识别结果对业务进行控制。

    2.如权利要求1所述的方法,其特征在于,所述识别所述人体的目标部位在所述视频片段中的移动轨迹,包括:

    针对所述待处理视频片段中的每个视频帧,分别确定所述目标部位的区域;

    根据各个视频帧中所述目标部位的区域变化,确定所述目标部位在所述视频片段中的移动轨迹。

    3.如权利要求2所述的方法,其特征在于,所述根据各个视频帧中所述目标部位的区域变化,确定所述目标部位在所述待处理视频片段中的移动轨迹,包括:

    针对所述待处理视频片段中多个视频帧,在识别到视频帧中所述目标部位所呈现的动作为预设行为中的第一预设动作时,开始记录视频帧中目标部位的区域的相对位置,直到识别到视频帧中目标部位所呈现的动作为所述预设行为中的第二预设动作时,获得移动轨迹。

    4.如权利要求3所述的方法,其特征在于,视频帧中目标部位的区域的相对位置为所述目标部位中的目标子部位在所述视频帧中的相对位置。

    5.如权利要求2所述的方法,其特征在于,所述目标部位包括所述人体中多个目标部位,所述根据各个视频帧中所述目标部位的区域变化,确定所述目标部位在所述待处理视频片段中的移动轨迹,包括:

    拼接各个视频帧中所述多个目标部位的区域变化,获得移动轨迹。

    6.如权利要求1~5任一项所述的方法,其特征在于,所述根据所述移动轨迹,获得与所述移动轨迹相应的移动轨迹图,包括:

    将所述移动轨迹中各个点的位置映射在图像中的相应位置,获得与所述移动轨迹相应的移动轨迹图。

    7.如权利要求3所述的方法,其特征在于,在所述开始记录视频帧中目标部位的相对位置之后,所述方法还包括:控制显示记录的相对位置;以及,

    所述根据内容识别结果对业务进行控制,包括:控制显示所述移动轨迹图的内容识别结果。

    8.如权利要求7所述的方法,其特征在于,所述根据内容识别结果对业务进行控制,还包括:

    在所述内容识别结果与预设内容匹配时,生成并控制显示告警信息;所述告警信息用于指示所述人体对应的人当前处于危险状态。

    9.如权利要求8所述的方法,其特征在于,所述待处理视频片段包括从监控摄像头获取的视频流中检测出包括人体的连续多个视频帧;所述告警信息包括所述人体当前所处的位置信息;所述位置信息是通过如下任一方式获得:

    对所述待处理视频片段中的任一视频帧进行内容识别获得的;

    根据所述监控摄像头的位置确定的。

    10.一种业务控制装置,其特征在于,包括:

    获取模块,用于获取包含人体的待处理视频片段;

    轨迹识别模块,用于识别所述人体的目标部位在所述待处理视频片段中的移动轨迹;

    获得模块,用于根据所述移动轨迹,获得与所述移动轨迹相应的移动轨迹图;

    内容识别模块,用于对所述移动轨迹图进行内容识别;

    业务控制模块,用于根据内容识别结果对业务进行控制。

    11.如权利要求10所述的装置,其特征在于,所述轨迹识别模块具体用于:

    针对所述待处理视频片段中的每个视频帧,分别确定所述目标部位的区域;

    根据各个视频帧中所述目标部位的区域变化,确定所述目标部位在所述视频片段中的移动轨迹。

    12.一种计算机设备,其特征在于,包括:

    至少一个处理器,以及

    与所述至少一个处理器通信连接的存储器;

    其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如权利要求1~9中任一项所述的方法。

    13.一种存储介质,其特征在于,所述存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1~9中任一项所述的方法。

    技术总结
    本申请提供了一种业务控制方法、装置、设备及介质,涉及人工智能技术领域,尤其涉及图像识别技术领域,该方法用于提高业务控制的准确性。该方法包括:获取包含人体的待处理视频片段;识别人体的目标部位在待处理视频片段中的移动轨迹;根据移动轨迹,获得与移动轨迹相应的移动轨迹图;对移动轨迹图进行内容识别;根据内容识别结果对业务进行控制,该方法根据人体中目标部位在移动过程中所产生的移动轨迹的识别结果,对业务进行相应的控制,相较于识别单帧的动作的方式,该方法能够更准确地识别人体的实际情况,进而提升业务控制的准确性。

    技术研发人员:裴歌;唐梦云;夏茂才;刘水生
    受保护的技术使用者:腾讯科技(深圳)有限公司
    技术研发日:2020.11.19
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-6652.html

    最新回复(0)