一种用户标识生成方法、装置及终端设备与流程

文档序号:19943678发布日期:2020-02-14 23:33
一种用户标识生成方法、装置及终端设备与流程

本申请属于数据处理技术领域,尤其涉及用户标识生成方法及终端设备。



背景技术:

用户画像,即用户信息标签化,通过收集与分析用户静态属性数据、社会属性数据、行为属性数据等元数据之后,构建出表征用户属性信息的标签体系,用于支撑个性化推荐等大数据场景应用的基本方式,其中,线下用户画像和线上用户画像,分别是指对通过线下和线上收集的用户元数据进行分析后,构建得到的两类用户画像。

在将用户画像结合实际场景应用时,需要对用户画像选取或生成至少一个用户标识,用以将用户画像与真实用户进行匹配,例如,利用身份证号作为用户画像的用户标识时,通过检测真实用户的身份证号是否与用户画像相同,来匹配真实用户实际对应的用户画像。

然而相关技术中在进行真实用户与线下用户画像进行匹配时,存在匹配准确率较低的问题。



技术实现要素:

有鉴于此,本申请实施例提供了一种用户标识生成方法及终端设备,以解决相关技术中真实用户与线下用户画像进行匹配时,匹配准确率较低的问题。

本申请实施例的第一方面提供了一种用户标识生成方法,包括:

获取第一元数据,并对所述第一元数据中包含用户人脸的图像进行特征分析,得到第一人脸特征数据;

获取至少一个第二人脸特征数据,并将所述第一人脸特征数据与所述至少一个第二人脸特征数据进行匹配,其中,所述第二人脸特征数据为对第二元数据中包含用户人脸的图像进行特征分析得到的人脸特征数据,第二元数据为历史获取的元数据;

若所述至少一个第二人脸特征数据中存在与所述第一人脸特征数据相匹配的人脸特征数据,将所述相匹配的人脸特征数据作为第三人脸特征数据,获取所述第三人脸特征数据对应的第二元数据,并基于所述第一元数据和获取到的第二元数据构建用户画像;

对所述第一人脸特征数据和所述第三人脸特征数据进行融合,并将融合后的特征数据设置为所述用户画像的用户标识。

本申请实施例的第二方面提供了一种用户标识生成装置,包括:

特征分析模块,用于获取第一元数据,并对所述第一元数据中包含用户人脸的图像进行特征分析,得到第一人脸特征数据;

特征匹配模块,用于获取至少一个第二人脸特征数据,并将所述第一人脸特征数据与所述至少一个第二人脸特征数据进行匹配,其中,所述第二人脸特征数据为对第二元数据中包含用户人脸的图像进行特征分析得到的人脸特征数据,第二元数据为历史获取的元数据;

画像构建模块,用于若所述至少一个第二人脸特征数据中存在与所述第一人脸特征数据相匹配的人脸特征数据,将所述相匹配的人脸特征数据作为第三人脸特征数据,获取所述第三人脸特征数据对应的第二元数据,并基于所述第一元数据和获取到的第二元数据构建用户画像;

标识设置模块,用于对所述第一人脸特征数据和所述第三人脸特征数据进行融合,并将融合后的特征数据设置为所述用户画像的用户标识。

本申请实施例的第三方面提供了一种终端设备,所述终端设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述用户标识生成方法的步骤。

本申请实施例的第四方面提供了一种计算机可读存储介质,包括:存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述用户标识生成方法的步骤。

第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述用户标识生成方法。

本申请实施例与相关技术相比存在的有益效果是:在获取到用户的元数据时,通过对其中的用户人脸图像进行特征分析,并将分析得到的人脸特征数据作为该用户的唯一标识,来对历史储存的用户元数据的人脸特征数据进行匹配,实现对实时用户历史元数据的精确匹配,再基于用户此次元数据和历史元数据共同构建用户实时用户画像,并将此次分析得到的人脸特征数据和历史元数据对应的人脸特征数据进行融合,作为实时用户画像的用户标识,相对采用注册账号、手机号或者身份证号等用户唯一属性数据来作为用户画像的用户标识而言,可以适应于更多种类场景下的匹配需求,同时每次都进行实时更新,使得实时融合的特征数据可以应对更多不同环境下的场景,对真实用户和用户画像的匹配场景覆盖能力更强,匹配更为精准可靠。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例一提供的用户标识生成方法的实现流程示意图;

图2a是本申请实施例二提供的用户标识生成方法的实现流程示意图;

图2b是本申请实施例二提供的特征数据库中特征数据类的示意图;

图3是本申请实施例三提供的用户标识生成方法的实现流程示意图;

图4a是本申请实施例四提供的用户标识生成方法的实现流程示意图;

图4b是本申请实施例四提供的特征数据库中特征数据类的示意图;

图5是本申请实施例五提供的用户标识生成方法的实现流程示意图;

图6是本申请实施例六提供的用户标识生成方法的实现流程示意图;

图7是本申请实施例七提供的用户标识生成装置的结构示意图;

图8是本申请实施例八提供的终端设备的示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。

为了便于理解本申请,此处先对本申请实施例进行简要说明,在进行真实用户和用户画像匹配时,可能会遇到各种不同的实际场景,例如在用户服装店利用手机付款购买衣服、在药店登记身份证号购买药物以及在超市进行会员账号结账等,而这些不同的实际场景中可获取到的用户唯一属性数据一般会存在较大的差异,如上述进行手机付款时可以获取到用户的支付账户或手机号,进行药物购买时可以获取到用户的身份证号,而登录会员时则可以获取到用户的会员账号,因此,尽管注册账号、手机号、支付账户或者身份证号等用户唯一属性数据可以作为用户画像的用户标识,进行用户画像与真实用户的匹配,但这些用户标识对场景的适应性极差,在不同的场景下还是需要进行用户标识的重新生成或选取,例如假设将超市会员账号设置为用户画像的用户标识,此时用户在服装店进行消费时,首先用户在服装店不一定有会员账号,其次即使用户在服装店有会员账号,其与在用户超市的会员账号一般也是互不相同的,因此对于此次真实用户行为而言就无法直接根据设定好的用户标识进行用户画像的匹配,从而导致丢失此次真实用户的行为数据,因此,直接使用注册账号、手机号、支付账户或者身份证号等用户唯一属性数据来作为用户画像的用户标识,会使得用户画像对实际应用场景的覆盖能力较弱,无法应对实际应用中多种类场景下的真实用户匹配准确性需求。

为了提高用户标识对实际场景的适应性,保证各类场景下真实用户与用户画像的准确匹配准确性,本申请实施例采用了对用户人脸图像进行分析得到的用户人脸特征数据作为用户画像的用户标识,由于人脸图像是用户自然人本身的特征数据,而非像注册账号、手机号或者支付账户等是对用户身份映射的用户唯一属性数据,因此无论在何种场景之下人脸图像都可以很好地唯一标识用户身份,即用户人脸图像可以直接适应各种不同的实际场景需求,从而使得本申请实施例可以更好保证用户画像与真实用户之间的匹配准确性。

同时,在将人脸特征数据作为用户画像的用户标识时,申请人又发现,由于在进行用户人脸图像获取时人脸图像的质量会受到实时场景内拍摄环境的极大影响,例如每次拍摄时的环境光线、拍摄的角度以及用户自身的姿态等,都会导致实际拍摄的人脸画像存在较大差异,因此若直接将人脸图像的人脸特征数据作为用户标识,仍可能存在不同场景下的用户标识难以准确匹配的问题,为了解决这一问题,本申请实施例在获取到用户的元数据时,通过对其中的用户人脸图像进行特征分析,并将分析得到的人脸特征数据来对历史储存的用户元数据的人脸特征数据进行匹配,实现对实时用户历史元数据的精确匹配,再基于用户此次元数据和历史元数据共同构建用户实时用户画像,并将此次分析得到的人脸特征数据和历史元数据对应的人脸特征数据进行融合,作为实时用户画像的用户标识。由于实时的用户标识是由当次采集的人脸图像特征数据以及历史采集的人脸图像特征数据融合更新而成,相对单次采集的人脸图像而言,人脸图像识别准确性更高对各种场景的兼容能力更强,同时由于每一次获取到用户的人脸图像时都可以更新修正一次线下用户图像以及对应的用户标识,从而使得实时融合的特征数据可以应对更多不同环境下的场景,且对场景的兼容能力会随着采集的元数据增多而变强,从而对真实用户和用户画像的匹配场景覆盖能力更强,匹配更为精准可靠。

同时,本申请实施例之中用户标识生成方法的执行主体为具有一定数据处理能力的终端设备,具体的终端设备类型可由技术人员根据实际应用场景的需求进行选定,此处不予限定,包括但不限如服务器和电脑终端。其中,具有一定数据处理能力,是指具有可进行本申请实施例中的人脸特征数据分析、人脸特征数据匹配、用户画像构建以及人脸特征数据融合的能力。

对本申请实施例的详细说明如下:

图1示出了本申请实施例一提供的用户标识生成方法的实现流程图,详述如下:

s101,获取第一元数据,并对第一元数据中包含用户人脸的图像进行特征分析,得到第一人脸特征数据。

在本申请实施例中,第一元数据是指此次对实际场景进行用户元数据采集得到的,包含用户人脸的图像的元数据,例如用户在饭店消费时获取到的用户图像、消费的日期、消费的菜品以及消费金额等,与第一元数据相对应的,在本申请实施例中,第二元数据是指历史对不同用户进行元数据采集储存所得到的元数据。其中,第一元数据由具体场景内的终端设备对用户线下行为进行数据记录得到,例如在上述饭店消费场景中,由饭店内的电脑和摄像头等终端设备来对用户的第一元数据进行记录。在终端设备记录好第一元数据的基础上,再由这些终端设备与本申请实施例的执行主体进行数据交互,从而实现本申请实施例对第一元数据的获取,例如,假设本申请实施例的执行主体为服务器,此时可以由终端设备主动将获取到的第一元数据发送给服务器,或者由服务器主动向终端设备发送数据获取请求,以获取所需的第一元数据。

同时,在获取到第一元数据之后,本申请实施例会对其中包含用户人脸的图像进行特征分析,得到对应的第一人脸特征数据,以为后续对用户画像和用户标识的实时更新提供所需数据,其中,第一元数据包含用户人脸的图像,既可以是用户人脸图像,也可以是包含用户人脸的用户身体图像等,具体由实际场景中采集到的用户图像决定,其中,若是包含用户人脸的用户身体图像,则在进行特征分析时,对其中的人脸部分图像进行分析,以下均以用户人脸画像为例进行说明。同时,具体特征分析方法此处不予限定,可由技术人员根据实际应用需求进行选取设定,包括但不限于如对用户人脸图像进行五官特征、颜色特征、纹理特征、形状特征和空间关系特征中的任意一种或多种特征进行提取,得到本申请实施例所需的第一人脸特征数据。

s102,获取至少一个第二人脸特征数据,并将第一人脸特征数据与至少一个第二人脸特征数据进行匹配,其中,第二人脸特征数据为对第二元数据中包含用户人脸的图像进行特征分析得到的人脸特征数据,第二元数据为历史获取的元数据。

在本申请实施例中,第二人脸特征数据,是指对第二元数据中的包含用户人脸的图像进行特征分析后得到的人脸特征数据,其中,每条第二元数据仅可分析得到一条对应的第二人脸特征数据,同时,对第二元数据内用户人脸图像的特征分析方法,应与s101中对第一元数据内用户人脸图像的特征分析方法相同。同时,具体的第二元数据数量此处不予限定,可根据实际实时对所有用户的元数据采集情况决定,亦可由技术人员根据实际应用需求来选取和设定具体使用的第二元数据及数量。

在分析出第一元数据对应的第一人脸特征数据之后,本申请实施例会以该第一人脸特征数据作为第一元数据的匹配标识,将第一人脸特征数据与历史元数据对应的第二人脸特征数据进行数据匹配,并从中筛选出数据相似度较高的第二人脸特征数据,即筛选出匹配度高的用户人脸图像,从而实现了对同一用户对应的所有人脸图像的匹配查找。其中,具体的人脸特征数据匹配方法此处不予限定,可由技术人员根据实际需求进行选取或设定,包括但不限于如,逐一将每个第二人脸特征数据与第一人脸特征数据进行数据比对,得到与每个第二人脸特征数据一一对应的多个匹配分数,或者参考本申请实施例二和三,以及其他相关实施例的说明。

s103,若至少一个第二人脸特征数据中存在与第一人脸特征数据相匹配的人脸特征数据,将相匹配的人脸特征数据作为第三人脸特征数据,获取第三人脸特征数据对应的第二元数据,并基于第一元数据和获取到的第二元数据构建用户画像。

当第二人脸特征数据中存在与第一人脸特征数据匹配的人脸特征数据时,说明此次分析的用户也存在对应的历史元数据,因此此时本申请实施例会直接将匹配的人脸特征数据来作为第三人脸特征数据进行处理。

在筛选出第三人脸特征数据之后,本申请实施例会进一步地从历史元数据之中提取出第三人脸特征数据对应的所有第二元数据,从而实现了对用户所有元数据的准确提取,同时在此基础上,本申请实施例还会对第一元数据和提取出的所有第二元数据进行处理,构建出用户最新的用户画像,从而实现对该用户用户画像的实时更新。其中具体的用户画像构建方法此处不予限定,可由技术人员根据实际应用需求选取设定。

s104,对第一人脸特征数据和第三人脸特征数据进行融合,并将融合后的特征数据设置为用户画像的用户标识。

在构建最新的用户画像的同时,本申请实施例还会同步生成对应的用户标识,其中由上述分析可知,虽然使用人脸特征数据作为用户标识,一定程度上可以实现对不同场景下真实用户匹配,但由于拍摄环境对用户人脸图像的质量影响极大,因此直接使用对用户人脸图像分析得到的人脸特征数据作为用户标识,仍会存在不同场景下真实用户与用户画像之间用户标识不一的情况。为了解决这一问题,本申请实施例中不会直接使用单张用户人脸图像的人脸特征数据作为用户标识,而是会将所有用户人脸图像对应的人脸特征数据进行融合,并将得到融合的特征数据来作为对应的用户标识,由于用户具有历史元数据,即说明用户是具有根据历史元数据构建出的用户画像的,因此在本申请实施例中,实质是根据最新的元数据对用户旧的用户画像进行实时更新修正,同时对对应的用户标识也进行实时的更新修正,因此本申请实施例中的用户标识一直是最新的,可适用于更多不同拍摄环境下进行真实用户匹配的用户标识。

在本申请实施例一中,由于实时更新的用户标识,是由此次采集的人脸图像特征数据以及历史采集的人脸图像特征数据融合更新而成,相对单次采集的人脸图像而言,人脸图像识别准确性更高对各种场景的兼容能力更强,同时由于每一次获取到用户的人脸图像时都可以更新修正一次线下用户图像以及对应的用户标识,从而使得实时融合的特征数据可以应对更多不同环境下的场景,且对场景的兼容能力会随着采集的元数据增多而变强,从而对真实用户和用户画像的匹配场景覆盖能力更强,匹配更为精准可靠。

作为本申请实施例一中对第二人脸特征数据进行匹配筛选的一种具体实现方式,考虑到不同场景下实际的拍摄环境一般会存在差异,而对于两个独立的场景拍摄环境而言,其对用户人脸图像的拍摄影响差异程度,既可能非常大,例如环境光线、拍摄的角度以及用户自身的姿态均差异均完全不同,也可能非常小,例如仅环境光线的强度存在一些差异。对于拍摄影响差异程度极大的两个场景而言,其最终得到用户人脸图像之间必定会存在极大的差异,甚至直接可能导致对应的用户人脸图像匹配结果为不是同一人,而对于拍摄影响差异程度极小的两个场景而言,得到的用户人脸图像可能相似度极高,从而可以轻易匹配出是同一人。由此可知,在将第二人脸特征数据与第一人脸特征数据进行匹配时,若直接进行逐对数据的比对匹配,极有可能出现与本次场景拍摄影响差异程度较大的场景对应的第二人脸特征数据,无法正常与本次得到的第一人脸特征数据进行匹配的情况,即对此次场景下的用户人脸图像兼容性较差识别不准确,从而导致同一用户元数据查找不准确的情况出现。

为了保障对每次用户人脸图像匹配的精准性,保障对不同拍摄环境场景的兼容能力,如图2a和图2b所示,本申请实施例二会以聚类的形式对人脸特征数据进行处理,具体包括:

s201,分别计算第一人脸特征数据与特征数据库内各个特征数据类的聚类指数,其中,特征数据库内包含至少一个特征数据类,每个特征数据类中包含至少一个第二人脸特征数据。

在本申请实施例中,会将历史元数据对应的第二人脸特征数据储存在一个特征数据库之中,同时还会对特征数据库中的所有第二人脸特征数据进行聚类处理,即将同一用户的第二人脸特征数据均聚为一类,从而得到与用户一一对应的一个或多个特征数据类。其中,具体的聚类方法此处不予限定,可由技术人员根据需求自行设定。为了便于理解本申请实施例,参考图2b,假设矩形框为特征数据库范围,矩形框内的每个点均表示一个第二人脸特征数据,cn表示第n特征数据类,由图2b可知,此时特征数据库中共有26个第二人脸特征数据,5个特征数据类,其中各个特征数据类内包含的第二人脸特征数据数量分别为1、8、4、2和11。

同时,聚类指数是指单个人脸特征数据可归属于某一特征数据类的程度量化指标,具体而言,聚类指数高低与是否可归属某一特征数据类的概率高低既可以是正相关也可以是负相关,需由具体选用的聚类指数类型决定,例如当选取数据相似度等指标来作为聚类指数时,聚类指数越大说明单个人脸特征数据越有可能属于某一特征数据类,而当选取特征数据向量距离等指标来作为聚类指数时,向量距离越大说明单个人脸特征数据越不可能属于某一特征数据类。

本申请实施例在得到第一人脸特征数据之后,会获取特征数据库并计算第一人脸特征数据与特征数据库中各个数据类的聚类指数,以为后续对第一人脸特征数据的分类提供数据。其中,具体使用的聚类指数类型以及对应的聚类指数计算方法,此处不予限定,可由技术人员根据实际需求进行选取或设定,包括但不限于如先分别计算第一人脸特征数据与某个特征数据类内的每条第二人脸特征数据的数据相似度,再计算这些数据相似度的平均值作为聚类指数,此时聚类指数越高,说明第一人脸特征数据越有可能属于该特征数据类,亦可以参考本申请实施例三进行处理。

s202,若存在聚类指数属于第一指数范围的特征数据类,则将聚类指数属于第一指数范围的特征数据类中包含的所有第二人脸特征数据,作为与第一人脸特征数据匹配成功的人脸特征数据。

在计算出具体的聚类指数之后,本申请实施例判断是否有聚类指数满足预设条件的特征数据类,即第一人脸特征数据可归属的特征数据类,若存在,则将这些特征数据类中的所有第二人脸特征数据,均识别为此次用户的人脸特征数据。其中,第一指数范围的具体值,可由技术人员根据实际选取的聚类指数类型,以及对人脸特征聚类识别的精确度需求设置,例如上述实例中,先分别计算第一人脸特征数据与某个特征数据类内的每条第二人脸特征数据的数据相似度,再计算这些数据相似度的平均值作为聚类指数,此时第一指数范围可以设置为[n,1],其中,0<n<1,具体n值可由技术人员自行设定。

其中,应当理解地,考虑到实际应用中原始数据的差异偶然性和实际选用的分类方法的精确性不同,均会影响最终分类结果的精准性,即在本申请实施例二中,根据实际应用情况的不同,特征数据库内对第二人脸特征数据的分类也不一定非常可靠,即可能存在用户a的第二人脸特征数据被同时分为2个特征数据类的情况,此时,若仅仅只是查找一个最大可能性的可归属特征数据类,最终对用户历史元数据查找仍可能不准确,因此在本申请实施例中,并未限定最终可筛选出的特征数据类的数量,只要是满足聚类指数要求的特征数据类,无论数量多少均会被筛选出来。

在本申请实施例二中,通过预先对历史元数据的第二人脸特征数据进行储存和聚类,再在分析出第一元数据的第一人脸特征数据时,对第一人脸特征数据进行聚类分析,最后将所有满足聚类要求的特征数据类内的第二人脸特征数据,均识别为当前用户的人脸特征数据,此时即使第一人脸特征数据和某个第二人脸特征数据拍摄环境差异较大,由于本申请实施例分析的是第一人脸特征数据与一类特征数据的相似情况,而不是仅仅分析两条人脸特征数据之间相似情况,从而使得本申请实施例仍可以准确地查找出同一用户在各种拍摄环境下用户人脸图像的人脸特征数据,进而保证了对不同拍摄环境场景下用户人脸图像匹配的精准性。

作为本申请实施例二中计算聚类指数的一种具体实现方式,为了减小对聚类处理的工作量,如图3所示,在本申请实施例三中,所有的人脸特征数据均为人脸特征向量,所选用的聚类指数类型为人脸特征向量之间的向量距离,本申请实施例三,包括:

s301,对各个特征数据类内包含的所有第二人脸特征数据分别进行特征向量融合,得到与每个特征数据类一一对应的第二人脸特征向量。

其中,具体的特征向量融合方法此处不予限定,可由技术人员根据实际需求进行设定,包括但不限于如直接进行将各个人脸特征向量内对应的数值求均值得到对应的第二人脸特征向量。

s302,计算第一人脸特征向量与各个第二人脸特征向量之间的向量距离。

在本申请实施例中,首先会对每个特征数据类分别进行类内的人脸特征向量融合,从而得到具有各个特征数据类共性的第二人脸特征向量,再计算第一特征向量与各个第二人脸特征向量之间的向量距离,实现了对第一人脸特征数据对各个特征数据类归属程度的有效量化,同时,由于由于向量融合和距离计算的计算量相对较小,计算简单,从而使得本申请实施例可以减小对人脸特征数据聚类的工作量,提高聚类速度。

作为本申请的一个实施例,在本申请实施例二或者三筛选出与第一人脸特征数据向匹配的第三人脸特征数据之后,为了保障后续可以兼容不同拍摄环境,实现用户人脸图像的准确匹配识别,在本申请实施例中,包括:

将第一人脸特征数据储存至特征数据库,并将特征数据库中的第一人脸特征数据与第三人脸特征数据标记为同一类特征数据,更新特征数据库中特征数据类。

本申请实施例在完成对当前用户所有人脸特征数据的查找之后,会将查找出的所有第三人脸特征数据与此次分析出的第一人脸特征数据,均识别为当前用户对应的特征数据类,并将对特征数据库进行特征数据类的更新。

本申请实施例可以实现对特征数据库中特征数据类的实时更新修正,同时随着每次的人脸特征数据累积更新,可以使得特征数据类对不同拍摄环境下用户人脸图像识别的准确性更强,对不同拍摄环境的兼容性更强。

作为本申请的一个具体实施例,考虑到实际中,此次用户可能是一个新的用户,此时第二人脸特征数据中不会包含于第一人脸特征数据相匹配的数据,为了保障对新用户的及时处理,在本申请实施例一将第一人脸特征数据与第二人脸特征数据进行匹配之,本申请实施例,包括:

若至少一个第二人脸特征数据中不存在与第一人脸特征数据相匹配的人脸特征数据,基于第一元数据构建用户画像,并将第一人脸特征数据设置为用户画像的用户标识。

对于新用户,本申请实施例会直接基于此次获取到的第一元数据来构建新用户对应的用户画像,同时会将此次分析得到的第一特征数据直接设置为用户画像的用户标识,从而使得本申请实施例可以实现对新用户的用户画像绘制和用户标识生成,在此基础上,后续若又获取到该用户的元数据,则可以同时本申请实施例一的操作来实现对该用户的用户画像和用户标识的更新修正,从而使得本申请实施例可以兼容更多不同环境下的场景,对真实用户和用户画像的匹配场景覆盖能力更强,匹配更为精准可靠。

作为本申请实施例四,考虑到实际应用中分类前原始数据的差异偶然性和实际选用的分类方法的精确性不同,均会影响最终分类结果的精准性,导致分类可能会存在一定的误差,即使在上述本申请实施例一至三以及其他相关实施例完成对特征数据库的构建或更新后,也不能保障特征数据库中得到的特征数据类的准确可靠,如仍可能存在一个用户的人脸特征数据被同时分类到两个或以上的特征数据类中,或者多个不同用户的人脸特征数据被同时分类到一个特征数据类之中的情况,而这些错误的分类,又会在一次次的用户标识更新中被累加放大,最终用户标识的不可靠,使得用户画像无法与真实用户进行准确匹配。

为了保障特征数据库中各个特征数据类的分类准确性,避免分类错误的累加效应导致用户标识的不准确,在上述本申请实施例进行用户画像绘制、用户标识生成等操作的同时,本申请实施例四中会定时对特征数据库内的特征数据类进行清洗,并打散其中不可靠的分类,如图4a和图4b所示,本申请实施例四,包括:

s401,每隔第一时间间隔对特征数据库中的各个特征数据类分别进行特征质量分析,得到与各个特征数据类一一对应的特征质量参数。

第一时间间隔是指相邻的两次特征质量分析之间的时间间隔,其中,第一时间间隔的具体值可由技术人员根据实际需求进行设定,此处不予限定。

在本申请实施例中,特征质量参数是指对特征数据类的质量进行量化后得到的量化值,其中特征质量参数的具体参数类型以及实际使用的特征质量分析方法,均可由技术人员根据实际需求进行设定,此处不予限定,包括但不限于如,获取特征数据类对应的更新频率,并对更新频率和特征数据类内包含的人脸特征数据数量进行加权计算,并将加权计算结果作为本申请实施例中的特征质量参数。

s402,查找出特征质量参数属于第一参数范围的特征数据类,并将查找出的特征数据类拆分为仅包含一个第二人脸特征数据的一个或多个特征数据类,更新特征数据库中特征数据类。

为了实现对特征数据类的清洗,本申请实施例中首先会对各个特征数据类进行特征质量的评估分析得到对应的特征质量参数,再对基于特征质量参数对各个特征数据类进行筛选,找出其中质量较差的特征数据类。其中第一参数范围用于对特征质量参数进行筛选,对特征质量参数落入第一参数范围的特征数据类,本申请实施例会直接将其识别为质量不佳,分类不够准确可靠的特征数据类,第一参数范围可由技术人员根据实际需求进行设定。

在查找出质量较差的特征数据类之后,本申请实施例会直接将这些特征数据类打散,即将特征数据类内的每个第二人脸特征数据的类标记都删除掉,并将类标记删除后的每一个第二人脸特征数据,均作为一个新的特征数据类进行类标记和储存,从而使得后续在进行用户画像绘制和用户标识处理的时候,可以重新对这些打散后的特征数据类进行再聚类和更新等操作。

作为本申请的一个实例,参考图2b和图4b,假设矩形框为特征数据库范围,矩形框内的每个点均表示一个第二人脸特征数据,cn表示第n特征数据类,cn中每个第二人脸特征数据的类标记均为n,同时,假设对图2b所示的特征数据库进行特征数据类的特征质量分析之后,判断出第4特征数据类质量差,分类的准确性和可靠性较差,此时本申请实施例四会直接将第4特征数据类进行人脸特征数据的打散,即将第4特征数据类内两个第二人脸特征数据的类标识4都删除掉,并生成如图4b所示的,仅包含一个人脸特征数据的第41特征数据类和第42特征数据类,同时将第41特征数据类和第42特征数据类内的第二人脸特征数据的类标记分别设置为41和42,在此基础上,后续对用户的标识进行更新时,第41特征数据类和第42特征数据类内的人脸特征数据又可以再次进行匹配分类和更新。

在本申请实施例中,定时对特征数据库中的特征数据类进行质量分析,并打散质量不合格的分类,实现对特征数据库的定时清洗,从而实现了即使在实际操作中出现不准确的分类,也可以及时去除分类并保留原始人脸特征数据,使得分类错误不会出现的错误累加效应。

作为本申请实施例四中进行特征质量分析的一种具体实现方式,如图5所示,本申请实施例五,包括:

s501,获取各个特征数据类的在第一时间段内的更新频率、最近一次更新时间到当前时间的时长以及包含的第二人脸特征数据的数量。

s502,基于更新频率、时长以及数量,识别各个特征数据类一一对应的特征质量参数。

考虑到实际情况中,对于分类不准确的特征数据类,其后续成功匹配真实用户人脸特征数据的概率相对会小很多,直接会导致该特征数据类的更新频率下降同时更新时间间隔增大,因此本申请实施例会同时获取每个特征数据类在预设时间段内的更新频率和最近一次的更新时长间隔,并将两个数据作为评判一个特征数据类质量的参考对象,同时在成功匹配真实用户人脸特征数据的概率下降,会导致相对其他正常的特征数据类而言,分类不准确的特征数据类包含的人脸特征数据数量往往难以上升,特别是在进过多次特征数据类的更新后,数量的差距会变得越来越大,因此,本申请实施例会同时将特征数据类内包含的人脸特征数据数量作为参考对象之一。其中,第一时间段的具体范围可由技术人员根据实际需求进行设定。

在获取到所需的更新频率、时长和数量数据之后,本申请实施例会进一步的对这些数据进行量化处理,并各个特征数据类分别对应的特征质量参数。其中,具体的量化处理方法此处不予限定,可由技术人员自行设定,包括但不限于如,对更新频率、时长和数量进行加权计算,并将得到的权值作为特征质量参数,或者预先对更新频率、时长和数量分别设置多个等级,并对各个频率等级、时长等级和数量等级的组合情况,设置对应的特征质量等级,此时本申请实施例只需要在获取到更新频率、时长和数量之后,查询分别对应的更新频率、时长和数量,再根据实际的频率等级、时长等级和数量等级,查询对应的特征质量等级并作为所需的特征质量参数即可。

作为本申请实施例六,如图6所示,在本申请实施例六中,上述本申请实施例一至五以及其他相关实施例中的元数据,均是指对用户在线下场景中行为进行元数据采集后得到的数据,对应的所构建的用户画像也是指线下用户画像,此时,在本申请实施例一至五以及其他相关实施例的基础上,本申请实施例可以实现对线下用户画像和用户标识的生成,同时可以保证线下用户画像用真实用户之间的有效匹配,但实际应用中,经常会需要将用户线下线上数据打通,即需要利用用户线上线下的元数据构建一个可适用于各种不同线上线下场景的融合用户画像,并选取或生成对应的有效用户标识以保证融合用户画像对真实用户的有效匹配,为了实现上述目的,本申请实施例六会在上述本申请实施例一至五以及其他相关实施例的基础上,来进行融合用户画像的绘制哈用户标识的设置,具体包括:

s601,查找与线下用户画像匹配的线上用户画像。

s602,将线下用户画像和线上用户画像进行画像融合,得到融合用户画像,并将融合后的特征数据设置为融合用户画像的用户标识。

其中,线上用户画像,是指基于用户线上元数据进行处理构建的用户画像。在本申请实施例中,为了实现对与线下用户画像匹配的线上用户画像的查找,以及对线下用户画像和线上用户画像融合,会针对线下线下元数据的特点,选取一个可同时作为线下用户画像用户标识和线上用户画像用户标识的用户数据,再基于该用户数据来查找与线下用户画像唯一对应的线上用户画像,并进行融合。其中对可同时作为线下用户画像用户标识和线上用户画像用户标识的用户数据的选取方法,此处不予限定,可由技术人员自行设定,包括但不限于如,分别列举出线下元数据和线下元数据内包含的用户唯一属性数据,再基于线下元数据的用户唯一属性数据,依次对各个线上元数据的用户唯一属性数据进行匹配,直至查找出匹配成功的用户唯一属性数据,同时,线下用户画像和线上用户画像的融合方法此处亦不予限定,可由技术人员根据实际需求进行设定。

在本申请实施例六中,通过将用户对应的线下线下用户画像进行融合,并将上述本申请实施例一至五以及其他相关实施例中计算得到的融合后的特征数据,作为融合用户画像的用户标识,使得融合用户画像的用户标识也可兼容更多不同的实际场景,保证了融合用户画像与真实用户的有效匹配。

在上述本申请实施例中,一方面,通过对每次分析得到的人脸特征数据进行聚类分析,并基于聚类结果对已存储的特征数据类进行更新,同时将计算聚类对应的融合特征数据作为用户画像的用户标识,使得实时更新生成的用户标识可以兼容更多的实际场景,保障了真实用户与用户画像之间匹配的准确性和可看出,另一方面,通过定时对特征数据库进行清理,使得分类不准确的特征数据类及时得以清除,进一步地保证了每次用户标识更新生成的可靠性和准确性,进而使得真实用户与用户画像之间匹配更为准确可靠。

对应于上文实施例的方法,图7示出了本申请实施例提供的用户标识生成装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。图7示例的用户标识生成装置可以是前述实施例一提供的用户标识生成方法的执行主体。

参照图7,该用户标识生成装置包括:

特征分析模块71,用于获取第一元数据,并对所述第一元数据中包含用户人脸的图像进行特征分析,得到第一人脸特征数据。

特征匹配模块72,用于获取获取至少一个第二人脸特征数据,并将所述第一人脸特征数据与所述至少一个第二人脸特征数据进行匹配,其中,所述第二人脸特征数据为对第二元数据中包含用户人脸的图像进行特征分析得到的人脸特征数据,第二元数据为历史获取的元数据。

画像构建模块73,用于若所述至少一个第二人脸特征数据中存在与所述第一人脸特征数据相匹配的人脸特征数据,将所述相匹配的人脸特征数据作为第三人脸特征数据,获取所述第三人脸特征数据对应的第二元数据,并基于所述第一元数据和获取到的第二元数据构建用户画像。

标识设置模块74,用于对所述第一人脸特征数据和所述第三人脸特征数据进行融合,并将融合后的特征数据设置为所述用户画像的用户标识。

进一步地,特征匹配模块72,包括:

聚类计算模块,用于分别计算所述第一人脸特征数据与特征数据库内各个特征数据类的聚类指数,其中,所述特征数据库内包含至少一个特征数据类,每个特征数据类中包含至少一个所述第二人脸特征数据。

数据筛选模块,用于若存在聚类指数属于第一指数范围的特征数据类,则将聚类指数属于第一指数范围的特征数据类中包含的所有第二人脸特征数据,作为与所述第一人脸特征数据匹配成功的人脸特征数据。

进一步地,聚类计算模块,包括:

所述第一人脸特征数据为第一人脸特征向量,所述聚类指数为向量距离,所述计算所述第一人脸特征数据与所述特征数据库内各个特征数据类的聚类指数,包括:

对各个所述特征数据类内包含的所有第二人脸特征数据分别进行特征向量融合,得到与每个所述特征数据类一一对应的第二人脸特征向量。

计算所述第一人脸特征向量与各个第二人脸特征向量之间的向量距离。

进一步地,该用户标识生成装置,还包括:

将所述第一人脸特征数据储存至所述特征数据库,并将所述特征数据库中的所述第一人脸特征数据与所述第三人脸特征数据标记为同一类特征数据,更新所述特征数据库中特征数据类。

进一步地,该用户标识生成装置,还包括:

若所述至少一个第二人脸特征数据中不存在与所述第一人脸特征数据相匹配的人脸特征数据,基于所述第一元数据构建用户画像,并将所述第一人脸特征数据设置为所述用户画像的用户标识。

进一步地,该用户标识生成装置,还包括:

每隔第一时间间隔对所述特征数据库中的各个特征数据类分别进行特征质量分析,得到与各个特征数据类一一对应的特征质量参数。

查找出所述特征质量参数属于第一参数范围的特征数据类,并将查找出的特征数据类拆分为仅包含一个第二人脸特征数据的一个或多个特征数据类,更新所述特征数据库中特征数据类。

进一步地,该用户标识生成装置,还包括:

查找与所述线下用户画像匹配的线上用户画像。

将所述线下用户画像和所述线上用户画像进行画像融合,得到融合用户画像,并将所述融合后的特征数据设置为所述融合用户画像的用户标识。

本申请实施例提供的用户标识生成装置中各模块实现各自功能的过程,具体可参考前述图1所示实施例一的描述,此处不再赘述。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。还应理解的是,虽然术语“第一”、“第二”等在文本中在一些本申请实施例中用来描述各种元素,但是这些元素不应该受到这些术语的限制。这些术语只是用来将一个元素与另一元素区分开。例如,第一表格可以被命名为第二表格,并且类似地,第二表格可以被命名为第一表格,而不背离各种所描述的实施例的范围。第一表格和第二表格都是表格,但是它们不是同一表格。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。

图8是本申请一实施例提供的终端设备的结构示意图。如图8所示,该实施例的终端设备8包括:至少一个处理器80(图8中仅示出一个)、存储器81,所述存储器81中存储有可在所述处理器80上运行的计算机程序82。所述处理器80执行所述计算机程序82时实现上述各个用户标识生成方法实施例中的步骤,例如图1所示的步骤101至104。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能,例如图7所示模块71至74的功能。

所述终端设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端设备8的示例,并不构成对终端设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入发送设备、网络接入设备、总线等。

所称处理器80可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器81在一些实施例中可以是所述终端设备8的内部存储单元,例如终端设备8的硬盘或内存。所述存储器81也可以是所述终端设备8的外部存储设备,例如所述终端设备8上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器81还可以既包括所述终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储操作系统、应用程序、引导装载程序(bootloader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器81还可以用于暂时地存储已经发送或者将要发送的数据。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、电载波信号、电信信号以及软件分发介质等。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使对应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
彩票开奖查询 广东11选5 500万彩票网 500w彩票 500w彩票 500w彩票 500w彩票 500w彩票 500w彩票 500w彩票 <258全本小说网>| <520免费小说阅读网>| <全本免费小说阅读网>| <斗牛棋牌>| <思路客>| <穿越之神医王妃>| <神荒>| <全本免费小说阅读网>| <豪门军少宠妻无度小说>| <免费小说阅读女生版>| <武动乾坤>| <天天棋牌>| <有声小说免费下载mp3>| <玄幻小说阅读网完结版>| <校园全能高手小说>| <天天棋牌>| <全本免费小说阅读网>| <免费完结言情小说>| <豪门军少宠妻无度小说>| <女生小说>| <校园全能高手小说>| <斗破苍穹续集天蚕土豆>|