用户画像技术总览
阅读本文,您将获得以下收益:
-
能够区分用户画像的不同意义
-
全面了解用户画像的全流程
-
理解用户画像被应用的原理
导读: 本文主题为《用户画像漫谈》,主要从以下几个方面介绍:
-
用户画像定义
-
用户画像要素
-
用户画像类型
-
用户画像常用维度
-
用户画像应用场景
-
用户画像周期
-
用户画像开发流程
-
用户画像验收方式
分享嘉宾|李凯东 某媒体公司 大数据总监
编辑整理|杨康 南京大学
出品社区|DataFun
01/比你更懂你
在分享之前,先来展示 4 个应用广泛的 APP 给我推荐的个性化内容。第一个信息流里面能看到有一些提高工作效率的工具,还有 SEO;第二个是读书类 APP,可以看到产品、统计学、数据、私域流量管理;第三个 APP,可以看到很多吃的,海鲜、高端白酒;第四个还是吃的内容,同时还有唱歌的。所以综合下来,通过以上线索,是不是能得出一个结论?我来自互联网,对产品、运营、数据有一定的关注,在生活上对吃,特别是海鲜比较感兴趣,同时可能也会比较喜欢听歌。我想说的是,完全正确。
**APP 是如何比你更懂你的?**我们知道,现在的信息传递方式已经不是以前官方发布什么内容,我们就看什么内容,而是通过各种推荐机制来推送内容。推荐怎么精准找到我喜欢的这些内容?有一个基石,这个基石就是用户画像,也就是我们今天要介绍的重点内容。
--
02/用户画像定义
1. 实时数据产品支撑业务场景
首先我们来看一下用户画像的定义。
在产品领域有两个用户画像的概念,一个是面向用户的用户画像,一个是面向产品的用户画像。在数据领域还没发展之前,用户画像,其实指的是面向产品的用户画像,以用户角色作为一种勾画目标用户、联系用户诉求与设计方向的有效工具。而在数据领域发展之后,也就是互联网的今天,如果我们来谈论用户画像,更多的都是聊面向用户的用户画像,简单来说就是给每个用户身上打很多的标签。
--
03/用户画像要素
面向产品的用户画像,它有 8 个要素,分别是代表基本性、代表同理性、代表真实性、代表独特性、代表目标性、代表数量性、代表应用性、代表长久性,面向产品的用户画像是产品经理为了产品设计,从经验、调研中获得的,并不是我们本次讨论的重点,这里不展开阐述。
--
04/用户画像类型
我们说面向用户的用户画像。从用户画像来源 主要分为 4 种类型,分别是:直采型、统计型、挖掘型和预测型。
直采型指直接从用户基础信息表里面取到的用户信息,不需要统计和加工。统计型利用用户日志数据,按照一定的规则进行简单统计形成标签;利用用户行为数据或者文本数据,结合业务规则和算法加工输出对应的属性值或分值,我们一般把它称为挖掘型;预测型是最后一种,它其实是算法标签的一种,原理与挖掘型标签相似。区别在于预测型的标签重点应用于典型的预测场景。比如电商要预测A用户明天是否会进行某一类商品的购买,这种得出的用户画像标签就是预测型。
--
05/用户画像常用维度
用户标签一般可以从 9 个维度进行分类,当然随着行业的发展和业务的特殊性,也会有更多的维度,这里就简单地抛砖引玉。
**这 9 个维度都包括什么?**首先是基础属性,包括了我们一般的社会属性,比如性别、职业、地理位置等;第二个是平台属性,包括了平台本身的一些属性,以及相应的位置信息;行为属性包括了登录、注册、激活这些行为;产品偏好我们这里面主要讲的是竞品偏好和内部产品偏好;兴趣偏好是非常重要的,我们一般都会记住用户的品牌偏好、类目偏好、标签偏好等;敏感度也是一个在营销中非常重要的标签类型,包括活动敏感度、优惠券敏感度、热点敏感度等;消费属性包括消费能力、消费行为、消费意愿等;用户生命周期就包括我们比较熟悉的导入、成长、成熟、休眠、流失;用户价值包括用户的活跃价值以及他的VIP等级等。
--
06/用户画像应用场景
用户画像会用在哪里?最开始其实已经说了,在推荐系统里面会用到用户画像,我们在用户分群的时候也会用到。什么是用户分群?比如用户在做运营的时候,希望给某一种特征类型的用户推一些内容,这种他就要用到用户分群,这属于精准营销的一部分。
我们在做一些产品分析的时候,也要看一下我们的用户都是什么样子,其实已经偏向于面向产品的用户画像概念了。我们想看看我们本身产品或某次活动,或某个产品线,它的用户到底是什么样子的,以更有效地指导我们后续的营销活动。当然在搜索和广告系统中也会用到,因为搜、广、推经常一起来说,当然在金融领域的风控和反欺诈过程中也应用得非常广泛。
**用户画像可以在互联网目前最流行的匹配方式都要基于用户画像。**营销系统也好,算法系统也罢,都是基于用户画像和信息画像通过算法或者匹配规则作为桥梁,构建起了目前互联网是主流的信息匹配方式,如果算法推动了用户对于信息获取方式的变革,用户画像这次变革的基石。
--
07/用户画像周期
在用户画像构建的时候,用户的行为画像是尤为重要的,因为行为画像更能体现用户的兴趣,也是给用户带来最佳体验的原因。我们并不是只记录一种行为画像,我们通过时间不同的跨度构建出了实时画像、短期画像、中期画像和长期画像,因为它会捕捉用户不同周期内的对信息的偏好。这里我写的时间跨度是一般的建议跨度,但是不同的产品时间跨度可能会不同,大家如果去构建,还需要根据实际的情况来。
接下来我们来看一下用户画像构建的全流程。
--
08/用户画像开发流程
一般来讲,用户画像在构建的流程中会经历画像标签体系设计、数据源确认、数据收集、数据验证、标签生产、标签落地和标签服务化 7 个步骤,每一个节点都很重要。如果你最开始设计得不够合理,你最后想提供服务化,对应到服务系统中的时候,可能不能达成最终的营销或者是推荐目标。如果你的数据源使用错误,你最终的标签可能就是错的。每一个节点都很关键,但是用户画像它也是逐步不断丰富的过程,所以这 7 个步骤也会在你生产的过程中,随着业务的不断丰富进行多次的重复执行。
--
09/用户画像验收方式
好标签生产出来之后,我们如何验证标签?如何保证自己的标签是有效的,可以被用?一般有 4 种验证方式:算法指标验证、分布验证、交叉验证和抽样验证。应用的时候我们经常要验证大量的预测标签,虽然算法我们一般都会用一些指标进行相应的验证,但实际上很多标签都非常难验证,反而是要通过分布验证、交叉验证和抽样验证来进行。
举例来说,一个用户在我们的产品里面并没有填他的性别信息,你如何验证?客观来讲没办法验证,但如果我们有多款产品,恰好在其他产品中填写了性别信息,我们就可以进行相应的交叉验证了。
还有什么办法,可以打电话去咨询一下用户,当然这样的做法肯定是少量的,但是我们可以进行一定量的这种验证,就可以实现我们的算法运证是否准确。所以可以看到,虽然算法指标标签非常多,但是它的验收很多时候是没办法直接用算法指标进行验证的。
**有些什么样的思路是更好的?**其中一个就是生产数据和数仓数据的对比校验,这个是非常重要的,因为我们很多挖掘算法,预测型的指标签都是通过数仓来的,如果通过生产库,也可以去进行一定的加工、生产和校验,这是一个很好的方法。
另外一个是你对业务的感知,比如我们预测一些用户出来说女性标签的分值是多少,我们取多少。比如做美妆,它一定是大概率是女性,你可以进行这种业务判断,抽样出一些数据来看一看是不是预测为女性。这些用户都购买了偏女性的商品品类,如果你有比较好的业务敏感度,也是对你的验证有很大帮助的。
今天的分享就到这里,谢谢大家。
▌2023数据智能创新与实践大会
第四届DataFunCon数据智能创新与实践大会将于⏰ 7月21-22日在北京召开,会议主题为新基建·新征程,聚焦数据智能四大体系:数据架构 、数据效能 、算法创新 、智能应用 。在这里,你将领略到数据智能技术实践最前沿的景观。
欢迎大家 点击下方链接获取大会门票~
DataFunCon2023(北京站):数据智能创新与实践大会