百度|客户画像赋能百度推广生态实践
航宇 稿
导读:百度推广是一个典型2B、2C结合的商业场景:一方面百度推广为客户(广告主)服务,为其提供易用的广告平台(广告投放系统、商机/订单系统等等),并获取优质的内容和服务能力;另一方面百度推广将客户的这些服务能力通过广告的形式提供给用户(网民),满足其娱乐/教育/购物等个性化需求,并在此过程中提升百度整体的商业价值。其中2C侧的画像「用户画像」已经相对比较成熟,并广泛应用于检索策略、营销赋能、观星盘、生态洞察等等场景,而2B侧的画像「客户画像」却往往被人所忽略。然而事实上,客户画像同样能发挥巨大的商业价值。下面笔者将从「生态健康发展」这个角度,为大家介绍下客户画像如何落地各类应用场景,为推广生态健康发展提供巨大的动能。
一、什么是百度推广生态?
所谓的推广生态,是指在百度推广过程中,各类角色(客户、用户、销售、运营、代理商、优化师、产品、策略、决策者等等)互相影响、互相作用的经济联合体,它们各司其职,但又形成互赖、互依、共生的推广生态系统。在这一商业生态系统中,虽有不同的利益驱动,但身在其中的组织和个人互利共存,资源共享,共同维持系统的延续和发展。然而当前推广生态系统,还处于「自然演进」的状态,表现在:
- 各角色之间只以自身利益为出发点,以“短期价值”驱动自身行为,缺乏长期的价值的指引;
- 处于“野蛮生长”的状态,缺乏对良币的有效保护、缺乏从宏观角度对生态的洞察和调控;
- 生态中各角色之间的服务效率还处于“粗放服务”的阶段,尤其表现在运营能力缺乏方法论的指引,无法释放客户的消费潜力。
因此相对应的,我们也会以「长期价值挖掘、宏观生态调控、精细化运营」三方面为抓手,以关键角色——客户(也就是广告主)为中心,维护推广生态健康、持续发展:
二、为什么用客户画像赋能生态?
赋能生态的前提是对生态中的关键角色——客户有足够充分的理解,并以此为基础洞察整个生态特征和落地应用。而单纯的数据(指标)会造成二者的背离,陷入要么只讲宏观大盘数据,夸夸其谈、纸上谈兵,要么死扣单个客户的数据细节,无法纵观大局的陷阱;此时最好的粘合剂便是客户画像。
举个例子:我们可以通过计算得知客户A的日均消费为1000元,转化3个,这个数据(指标)本身隐含的信息量非常小,混在大量的客户数据中无法产生价值;此时如果我们进一步对比行业均值得知这个客户在同行业中处于非常劣势的地位,那么我们就可以考虑通过对行业标杆能力的复制,赋能这个客户效果提升。
再进一步,如果能够结合客户历史操作行为、预算、充值续费等信息感知这个客户处于极大的流失风险中,那么我们就可以通过针对性的流失挽回策略安抚客户,延长客户的生命周期,从而带来更多的商业价值。在这个过程中,客户数据被抽取出特征、抽象成知识,一方面能够更高维、更形象的理解客户,一方面也为整个生态提供了更多分层、分群的可能,并能够结合业务场景真正落地应用。
三、客户画像如何建设?
考虑到长期价值挖掘、宏观生态调控、精细化运营三大抓手对画像的要求,客户画像必须能够满足以下3点:
- **「多维度、全生命周期刻画客户特征」**结合数理统计、数据挖掘、机器学习等手段,通过构建事实类、统计类、模型类标签和数据,对客户推广生命周期中的各个维度的特征进行刻画,这是对客户画像最基础的要求
- **「建设客户群体画像」**与用户画像不同的地方在于,用户画像的群体画像通常是根据分析对象而动态圈定的,典型的场景是某个客户分析自身广告受众,了解受众网民的兴趣、年龄分布等等;而客户画像除了这种自定义群体外,更多的是对已知的固定客群进行分析,例如对教育行业分析、对KA客户分析等等,这也是宏观生态调控对画像的要求——必须能够对生态中不同的客群进行对比、分析和洞察,才能进一步进行宏观调控
- **「建设时间序列画像」**长期价值挖掘和宏观生态调控都需要记录画像变迁的历史,才能更好的把控生态发展趋势、支持各类业务分析和决策。
结合百度推广自身商业特点,我们提出了六大方向、三大维度的“6+3”客户画像体系。
六大方向是指客户在推广生命周期中六个大类别,包括基本信息、客户价值、推广效果、推广账户、推广行为、异常风险。
- 「基本信息」: 客户自身固有属性,包括行业、所属地域、经营品牌、所属运营单位、推广产品线等等
- 「客户价值」: 客户的商业价值属性,包括生命周期阶段、消费潜力、推广意愿等等
- 「推广效果」: 客户的推广效果衡量,包括展点消转、竞得流量质量、匹配相关性等等
- 「推广账户」: 客户推广设置特征,包括物料规模、预算控制方式、出价水平等等
- 「推广行为」: 客户在推广过程中的行为特征,包括操作的自主性、调价等优化能力、充值续费特征等
- 「异常风险」: 客户自身风险及推广风险特征,包括套户推广、恶意超投、推广风险等级等等
通过六大方向的特征刻画,我们可以了解单一客户的静态特征,在此基础上,我们还在群体、时间两个维度进行拓展,从而形成方向+群体+时间的三维画像体系,即所谓的“6+3”客户画像体系。在完成客户画像体系设计后,我们实现了如下三层的解决方案支撑画像体系的建设和应用:
- 「计算层」:画像最底层也是最核心的技术层,包括「数据、计算平台、算法、模型」四部分,负责从海量数据中提取出客户的特征、抽象为知识,最终形成标签和数据为画像层服务。例如“超投”标签是指客户通过一些特定类型的操作组合hack系统,达到违规投放的目的,其产出方式为:以客户行为数据为基础(数据),使用序列分析apriori+cspade的方法(算法),通过spark对海量客户数据进行分析(计算平台),最终提取出超投客户及其行为特征,并形成了客户超投标签。再例如“品牌”标签是通过模型识别客户经营产品的品牌信息,其产出方式为:以客户广告物料为基础(数据),使用品牌识别模型(ernie进行fine-tuning配合crf序列标注)(模型),通过paddlepaddle平台搭建网络并进行训练和预测(计算平台),最终产出了客户的品牌标签。
- 「画像层」:对外进行画像能力输出的部分,包括「画像体系、画像存储和服务平台」三部分。画像体系会将计算层产出的客户标签,按照前述“6+3”的方式进行组织;画像存储是将画像标签和数据真实的存储于HTAP数据库BaikalDB,并对外提供查询服务(有别于用户画像的场景和位图类存储的方式,客户画像中包含大量数值类指标以及较小的规模(千万级),因此采用HTAP数据库效率和灵活性更好,此处不展开详述);画像服务平台是将画像的能力进行封装,并以平台的形式对外提供服务能力,包括画像展示(以个体或客群为对象,提供多维度的画像数据,辅助客户/客群洞察)、画像分析工具(任意标签组合的交并差集客群圈选、多维分析等)、业务场景定制(与实际业务深度结合,为使用者提供闭环式的工作环境)、实用工具集(针对单个问题的工具集合,如复合指标分解工具、客户行为分析工具等)等等。通过画像层的封装,我们可以将画像的能力与实际的应用场景相结合,真正为业务赋能。
- 「应用层」:是标签真正发挥价值的地方,与生态健康三大抓手相结合,孵化出能够真正落地执行的项目,为生态健康发展提供动能。其中长期价值挖掘方向我们建设了以LTV为核心的长期价值评价体系,并孵化了新手保护机制、客户增长、产品交叉售卖、检索策略优化等项目;宏观生态调控方向我们建设了以收入分析和客户健康为主视角的宏观生态评价体系,在深入洞察宏观生态的同时,为行业运营、产品运营提供了行业扶持、奖优惩劣的能力,辅助良币驱逐劣币;在精细化运营方向我们建设了以生命周期为核心的运营方法论,并通过画像的能力规模化、例行化、自动化的进行运营管理,从而解决运营效率低、客户提效难的问题。需要说明的是,生态健康是一个需要长期思考、探索的命题,我们当前的实践也只是这个命题中的一个截面,还有更多有价值的场景值得我们去发现、去实践。
四、如何赋能生态建设?
如前述客户画像通过赋能三大生态健康抓手,落地了很多实践项目,限于篇幅这里仅简单介绍精细化运营和检索策略优化两个应用案例。
4.1 精细化运营
客户的运营管理是一个非常依赖于经验的工作,新手和老手的运营能力可能差别非常大,这种全凭经验的粗放式管理方式会导致被运营的客户满意度相差很大,运营的效率低、成本高、效果也得不到保证,同时也非常不利于运营同学自身的发展。
基于当前运营现状,我们提出了通过客户画像赋能精细化运营的解决方案。解决方案的核心思路是:
- 整合高阶运营同学的成熟经验,通过合理聚类,把繁杂的运营工作拆解为营销场景,典型的场景如效果下降、流量不足、流失风险等等;
- 为每种营销场景定制解决方案,并形成标准化的作业手册下发给一线运营同学;
- 根据营销场景的定义,设计相应的算法模型,识别每个客户所属营销场景(画像标签);
- 规模化的向一线客服提供其所负责客户的营销场景标签,按照标准作业手册规定的步骤完成对这个客户的运营工作;
- 对整体运营工作进行监控和复盘,同时结合新的营销场景不断迭代画像建设。
一个典型的运营场景是:客户画像识别出客户A所处的营销场景是“流失风险高”,一线客服在拿到这个标签后查询标准作业手册中对应的行动步骤,然后按照指示执行运营工作,包括:
- 按照标准话术框架完成与客户的沟通;
- 提供优惠券等关怀政策,稳住客户;
- 解决客户问题。
当前客户画像赋能精细化运营已在各分公司、呼叫中心、大渠道进行广泛应用,目标客户各项指标均表现正向,较高的提升了客服运管效率和运营能力、更多的挖掘客户增长潜力。
4.2 检索策略优化
触发相关性优化一直是商业检索策略最重要的优化项目之一,一方面网民搜索query触发了不相关的广告,对网民搜索体验是较大伤害,另一方面对客户来讲,自己的广告被不相关的query误点击,也会造成自身消费的损失,对客户的推广积极性和长期价值会造成较大伤害。因此相关性优化无论对用户(网民)还是客户(广告主)都有重要的意义。
我们收集了大量类似投诉case,分析发现其中一种非常典型的场景是搜索query的目标业务,与触发广告的「经营业务」不匹配,这种query-ad虽然在字面相关性上很高,但实际上对应的是完全不同的业务,因此需要从触发上进行过滤。解决方案是通过客户画像的业务识别模型,对query和广告分别识别其业务标签,并在触发时过滤掉其中业务不同的query-ad pair。模型建设上使用了ernie进行finetuning,结构如下所示:
模型识别准确率达到95%,上线后在点击率ctr2、query-落地页相关性qlq等各项指标上均有提高,打击错匹配的同时较好的保护了客户的权益。
五、结语
客户画像是一把深入理解客户的钥匙,也是一座架设宏观生态和微观客户之间的桥梁。限于篇幅原因,本文仅对客户画像的建设方法和应用实践做了简单介绍,实际上客户画像可以在更多的场景发挥应用。相信在未来,画像将不仅仅局限于客户、用户这两个群体上,而是进入一个「万物皆可画像」的时代,涌现出更多的画像如媒体画像、内容画像、客服画像、代理商画像,并且画像之间的复杂关系网络,也会在推广生态建设上有更丰富的想象空间。