Fork me on GitHub

标签数据——用户 LBS 位置标签及 POI 数据如何从生产到应用?

作者:NK冬至 首席数据科学家

LBS相关的标签,是用户标签画像系统中的重要内容。

好久没有分享关于用户画像、用户标签相关的内容了。关于标签数据,之前有分享过《用户生命周期标签的计算》《用户偏好兴趣类标签如何计算》。今天分享一下,关于LBS相关的标签内容。

01 什么是LBS

讲LBS标签之前,先来看看LBS具体的一些内容吧。

(1)什么是LBS服务

LBS,即基于位置的服务(Location Based Services)。其实在日常我们的生活中,关于LBS的服务是非常常用的。

目前主要的LBS服务提供商,就是高德、百度、腾讯这些比较常见。其他绝大部分的APP应用,都是调用这些服务厂商提供的接口服务能力。

像我们常用的百度地图,基本产品逻辑就是围绕地理位置进行的。比如进行定位服务、路线规划、地点搜索、导航等等。

图片

再比如,外卖软件中骑手配送路径的实时展示、配送员调度等。

图片

相关的应用很多,所有涉及到地理位置的相关功能,都属于LBS的范畴。

(2)LBS服务的类别

总结下来,主要的LBS相关的服务可以总结为五类:地图服务、搜索服务、定位服务、路线规划服务、导航服务。

  • 地图服务

这个比较好理解,地图是LBS服务的基础。无论是导航、还是看定位等,都是要基于地图进行呈现。

图片

虽然地图很常见了,但是其实关于地图呈现的内容是非常多的。比如,地图的风格、地图的覆盖物(比如交通轨道、河流等)的选择、聚合点的设置、地图中心位置的设置等等……

图片

  • 搜索服务

所谓的搜索服务,即对地理位置相关的内容进行搜索。

基于不同的搜索对象,可以将搜索分为:POI数据搜索、地址数据搜索、行政区划数据搜索、公交数据搜索等等。

图片

比如上面,就是一个POI的搜索,这里能看到一个周边的围栏。关于POI和地址围栏,我们后面展开阐述。

  • 定位服务

定位其实比较好理解,就是确定目前设备所处的位置。

通常,服务提供商提供的定位信息,是基于GPS、基站、WIFI等内容进行的混合定位。相对单模式定位,会更加精准。

  • 路线规划及导航****服务

路线规划服务也比较好理解,就是提供两点之间的路线规划。

图片

路线规划是导航的前提。根据交通方式的不同,可以有多种路线规划方式,比如驾车路线规划、公交路线规划、骑行路线规划、步行路线规划等。

02 POI和地理围栏

上文中,我们提到了POI和地理围栏,由于比较重要,这里着重展开介绍一下。

(1)什么是POI

所谓的POI,即Point of Interest。怎么理解呢?比如,一个学校、一个小卖部、一个公交站、一个小区,都可以理解成一个POI。

想象一下,地图只是提供了一个底层的画板,只有在地图上叠加一个个的POI点位,地图的信息才能丰富起来,数据才有了价值。基于一个个的POI信息,可以进行更好的搜索、定位等等功能。

图片

比如上图,我们搜索“便利蜂”,出现的结果,就是和便利蜂相关的POI列表。

通常一个POI必备名称、地址(具体地址)、坐标(经纬度)、类别四个属性。至于其他属性,比如手机号、省市区等等,属于扩展信息。

(2)示例:高德的POI数据

我们看一下高德对外提供的POI接口数据。

首先是按照行政区域的POI数量:

图片

我们可以看到,光北京市的POI数量就达到了347万个。

我们看具体POI列表,就比较容易理解了:

图片

上面有机关单位、有汽车维修、有餐厅……这一个个具体的点,都是POI。每个POI除了列表中呈现的信息:名称、地址、电话、类别,还有啥信息呢?如下图:

图片

看到了吧,信息是非常全的。还有街景信息,这里就不放截图了。

(3)地理围栏

上文讲了POI。注意,POI是一个【点】。和【点】对应的概念是【区域】,我们称之为“围栏”。

比如一个小区,虽然也可以在POI列表中呈现,可以用一个经纬度表示定位。但我们知道,小区其实是一个区域,而不只是一个点。这时,如果为了更加精准的分析服务,我们需要用到地理围栏。

所谓围栏,就是一个封闭的区域。例如下图:

图片

百度地图中,用虚线将颐和园的边界进行了围起来。我们可以清楚的了解颐和园的区域范围,而不仅仅是一个POI点信息(其实颐和园也是有POI点的,上图中的序号位置1,就是颐和园的POI。如果只有POI而没有围栏,是不是效果差很多?)。

当然,大部分地理信息其实是不需要围栏的。比如便利蜂,我们没必要知道便利蜂门店精准的区域,基本经纬度就可以了。但是比如行政区(例如北京市海淀区)、小区、学校等,还是有必要了解围栏信息的。

03 地理位置标签

关于LBS和POI等相关的内容,上面也只是概括地讲了讲,细节层面确实内容非常丰富,值得大家深入研究研究。这里是时候进入我们的正题了,那就是地理位置相关的用户标签。

首先明确一下,我们这里的标签对象,是人:即给人打上和地理位置相关的标签。

(1)需求背景

我们在精准营销中,经常需要结合地理位置信息进行定向人群圈选,从而精准触达。

举个例子。我是一个线下便利店的店长,经营原浆啤酒。由于保质期短,且线下经营,潜在顾客基本就是店周边小区的人群,而且是爱喝啤酒的男顾客偏多。

图片

因此,我需要营销触达的人群应该是【门店周边3KM居住小区】+【男顾客】+【爱喝啤酒】。

关于【男顾客】、【爱喝啤酒】应该是基础标签、偏好标签,可以参考《用户偏好标签计算》。至于【门店周边3KM小区】这个标签该如何获得呢?

对,这就需要地理位置信息相关的标签了。

(2)具体计算逻辑

如何获得这个标签呢?这里的关键是对用户的历史LBS位置进行建模、计算。

这个模型说复杂也并不复杂,但是细节内容比较多。通常来讲,基于用户APP上传的地理位置信息,我们会同时给用户打三个地理位置相关标签:用户的家的位置、用户的公司的位置、用户常出现的位置(除家和公司外)。

由于用户使用APP的时长、频次通常不是很长,我们一般需要稍微长一点的数据来计算用户的地理信息标签。一般可以考虑使用近30天数据(过长也不合适,时效性差且计算量大)来计算标签。而且由于用户的行为通常比较稳定,标签的更新时效也没必要每日更新,能每周更新一次标签就可以了。

具体的计算逻辑主要有这么几条:

  • 工作日时间有地理位置的日志超过*%就判定该位置是公司;
  • 夜间有地理位置的日志超过*%就判定该位置是家;
  • 其余时间经常出现的日志最高的位置判定为常去地。

大的逻辑是这样,但是有很多细节计算逻辑,这里就不展开了。

(3)地理位置数据表

通过上面的计算,最终可以生成一张专门的用户地理位置相关的表。以用户ID为主键,分别三个字段:预测的家的位置、公司位置、常去地位置。

这里的原始地理位置,可以以经纬度进行存储。

04 LBS标签的产品应用

地理位置标签数据计算好了,如何进行产品化应用呢?其实主要就是进行人群的圈选。具体的圈选方式,可以有以下几种方案。

(1)基于具体POI+半径圈选

比如,上面例子中,我们想基于便利店周边3KM进行人群圈选。

便利店作为圆心的POI,圈选该POI周边半径3KM以内的人群作为目标人群,即可满足诉求。

图片

上面的截图是基于POI+距离半径来进行的人群圈选。【清华大学-北门】、【清华大学公寓】等都是一个个POI,下面的选择范围是距离半径。

(2)基于地理围栏圈选

第一种方式中,比较容易实现。但是有时想要圈选的更具体精准的某个区域内的人群。

比如想圈选北京市西城区的全部潜在人群,或者某个学校的所有学生,这时就需要借助地理围栏进行圈选。

从数据层面,除了需要用户地理位置信息、POI信息外,还需要相关的地理围栏信息。通过地理围栏才能判断用户是否在围栏内。

图片

上面这个就是基于POI围栏进行圈选。

下面这个基于行政区进行的圈人,本质也是地理围栏。但是由于场景比较多,就进行了单独呈现。

图片

(3)其他类型圈选

本质上,所有的圈选都要么是基于POI+半径,要么是基于围栏。但是上面也看到了,有些特殊场景,从产品设计层面可以单独拿出来,比如行政区圈选。

另外,可以看一下下面的基于场景圈人。

图片

这样可以对特定类型的人群进行圈选。

关于LBS、用户地理位置标签相关的内容就分享这些,欢迎大家继续关注~


本文地址:https://www.6aiq.com/article/1624053679639
本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出