宛言:爆款素材识别在快手的应用与实践
分享嘉宾:宛言 快手 高级数据分析师
编辑整理:何雨婷 湖北工业大学
出品平台:DataFunTalk
导读: 短视频社区经常会不定时涌现出许许多多的爆款视频,短时间内得到大量的播放与转发关注。比如前不久在快手上涌现出的与冬奥主题相关的“滑雪挑战”活动等素材玩法。在快手,如何提前监测并捕捉潜力视频以及对应的素材一直是我们工作的重点。今天就和大家分享一下爆款素材识别在快手的应用与实践。
全文将围绕以下四点展开:
- 内容素材概览
- 爆款必要元素
- 爆款识别的模型和工程框架
- 案例实践与展示
01 内容素材概览
1. 爆款素材识别的产生背景
在快手短视频平台上,每时每刻都有大量用户参与短视频的生产与消费,期间会产生大量的高热度视频,引起病毒式的传播和复制。对于平台方而言,需要设计一套高效可执行的方案提前捕捉有爆款潜力的素材,并及时地通过平台的资源,包括运营抓手与Reco推流,给一些扶持的流量,去放大爆款的马太效应。
整体站内爆款的监控与捕捉需要解决如下的问题:
- **时效性 ** - 能够及时地发现爆款;
- **准确率 ** - 捕捉的潜力爆款在后期能够真正成为平台数据后验的爆款;
- **复用性 ** - 设计的机制框架能够有效地从一个地区一个素材迁移到其他地区素材;
- **解释性 ** - 捕捉的爆款,能够追溯捕捉原理,并自我解释为何该素材有爆款潜力;
- **自动性 ** - 设计的机制能够自我调节,聪明地自我更新捕捉模型。
2. 什么是视频内容素材
本次主题分享中的爆款素材主要指以下四种:
- 第一种是活动,也叫做hashtag,第一张图片左下角中#ADMSTORY#就是一个hashtag。用户可以自定义Hashtag,平台方也会定期推送官方定义的hashtag,平台方会将大家拍摄短视频时带上的hashtag视作对这项活动的关联,后台会有运营抓手和落地的方式去收集相应的数据,追溯这个视频的表现效果,反过来看平台所推出的活动的参与情况。
- 第二种是音乐,在第二张图片右下角有一个音乐转盘,它表示在拍摄短视频时使用了这个音乐。
- 第三种是魔法表情,也就是特效。第三张图片中显示的是流星坠落的特效。特效也是平台非常重要的一个素材的落地方式。
- 最后一种是模板,模板可以理解为一种图集。当用户在上传视频或者是一组图集时,平台方会定义这些照片的串联方式,自动将图片嵌入到平台提供的模板图集中,生成一个渐变图集。
本次所说的爆款,更多的是针对上述四种情况下所关联的所有视频的表现。例如音乐爆款,魔法表情爆款,模板爆款,或者活动爆款等。
02 爆款必要元素
总结下来,爆款有三个非常直接的特点:播放增长快、像病毒一样复制并传播、用户参与度高。下面,针对这三个要素进行详细介绍。
1. 播放量增长快
相对普通素材而言,有爆款倾向的素材对应的播放量会有明显拔高。
我们如何去捕捉爆点?我们可以用播放概率的公式去套用:用当前t时刻的vv(播放量)值,除以过去24小时这个素材的vv总值,将其折算成一个0-1之间的概率,平台方通过播放概率的增长量判断是否会出现爆点。
2. 像病毒一样复制并传播
图中的左侧是模拟的一个网络结构,在这个图中,蓝点表示源头视频,绿点表示很多人看到了源头视频后,生产了相似的视频,红点表示红色的这群人,看了绿色的视频后进行了二次生产,紫点表示第三次生产,在进行一二三轮的传播过程中,随着传播越来越广,传播范围以指数型增长。如果某个视频有类似病毒一样复制并带动其他视频生产的能力,我们会将其定义为爆款。
我们如何衡量爆款病毒?
这里借用传播学中一个非常经典的R0系数的定义。当R0=1时,视频线性传播,指每一个单位时间有一个人看了并复制。当R0=2时,每单位时间有两个人看了并复制,是一个指数增长。因为R0会动态变化,每时每刻都不一样,因此难点在于我们如何衡量R0(Rt)。
我们选择使用近似预估,假设在某一段时间,产生了k个新用户, 当前时刻的Rt值我们可以用贝叶斯公式进行计算:使用先验的Rt值的概率(在不观测任何的数据的情况下,Rt值本身可能的分布),再乘上L分布。在实际操作中我们借用泊松分布去近似L分布:给定k值,遍历所有可能的λ值,画出不同λ值的泊松分布,观察曲线对应的纵坐标的概率值,选取对应概率值最大的λ值。估算出L分布的值之后,再乘上之前的先验分布,就能得出最终的Rt的分布。
3. 用户参与度高
所谓的用户参与度高,指平台方重点观测的点赞、评论、转发、搜索这四项指标的数据较高。
总结一下之前讲到的所有爆款元素,我们将其汇总成一张爆款特征的总结表,并给爆款素材评定SABC等级。
S级,所有的核心数据指标都要表现的非常好。A级略高于大盘的指标,有一些表现得好,有一些表现得一般。B基本上接近于大盘的一些指标。C在各个指标上都显著低于大盘指标。
我们将各项指标列举出来后,还需要把这些指标汇总成各类的评级,这需要我们将这些指标进行整合,接下来我们分享一下我们如何将整合各项指标。
03 爆款识别的模型和工程框架
为了提前预测爆款,我们搭建了一个爆款识别的框架。爆款识别和推荐系统非常相似,爆款识别的逻辑在于根据赞、评、关、转,包括播放量等指标挑选出有潜力的视频素材。而推荐系统是根据每个视频用户的浏览记录,作为特征去筛选类似的视频,然后给不同的用户推荐不同的视频。因而在爆款识别中我们借鉴了推荐系统。
这里展示一个最简单的推荐系统的链路框架,我把它拆成两部分,粗召部分和精排部分。
粗召部分, 包括特征输入、召回方法以及召回内容。
一个推荐系统的特征输入会有三部分:
① 用户画像,如用户的年龄、性别、地域等。
② 内容画像,如视频的时长、评论的次数或视频观看人数等。
③ 交互特征,交互特征与时序相关,例如某位用户在观看此视频后,还看了和本视频相关的哪些其他视频。
推荐模型的粗召部分会用很多经典的方法如协同过滤,矩阵分解,兴趣召回和关联策略等,通过这些方法召回部分最好的视频。
精排部分, 在拿到被召回的视频后,我们会开始精排。对召回的视频根据点击、转化、停留时长等优化目标重排序,得成准备好特征数据,输送到精排模型中。
推荐系统和爆款识别具体的区别在于:
- 粗召部分:推荐系统更多地召回有价值的内容,爆款识别尽可能多地召回有爆款潜力的内容;
- 精排部分:推荐系统要能够做到个性化分发,对不同的人分发各自喜好的视频。爆款识别在精排部分要能够调整顺序,根据不同业务要求筛选出各项指标符合要求的视频。
下面介绍我们的爆款识别框架。
1. 粗召部分
在粗召部分,我们设计了三种速度专门衡量视频热度:
① 一阶差分,即t1时刻与t2时刻某素材关联视频播放量的差值,
② 加速度,我们参考了推特去年发表的一篇论文,假设我们定义第一个时间周期,取这个周期内vv的平均值,再乘上e的负i次方( i指天数),做加权平均。然后用同样的方式计算更长的第二段周期的平均值,用第一个周期的vv减去第二个周期的vv得到的差值,将其定义成加速度。在实际实现的时候我们做了一些微调。
③ 爆款速度,用当前某时刻某指标的取值,除以过去该取值的总和。比如说用某时刻vv值除以过去24小时vv总和的比值。
但是不同的速度针对不同情况的表现差异很大,无法直接使用。
上图中红色曲线是原始增长速度,深紫色曲线表示它的加速度,蓝色曲线是它的一阶差分值,浅紫色曲线是爆款概率。当原始速度增长非常缓慢时(左侧图像),爆款概率值趋于稳定。当一个视频的vv增长非常迅速的时候,如右侧图像,加速度的深紫色线基本拟合原始数据的曲线,但部分检测点仍有些微滞后无法提前检测。一阶差分的蓝色曲线,变化特别快,难以监控。浅紫色曲线可以提前捕捉爆款点,但是太过敏感,概率波动很大。
真实情况中如果只选用一种速度进行判断,往往会出现差错。在这种情况下,我们设计了一个模型,把这三种速度作为三种特征,让模型去学习不同速度的权重比,并将其汇总,给出最终排序,希望既能提前又能准确地捕捉爆款。
2. 精排部分
精排部分,推荐系统是直接使用的大模型,但是爆款无法使用大模型。原因有二:
- 我们希望我们的模型是白盒模型,所有的参数,系数,以及输出都是可解释的;
- 可用来训练模型的数据非常少,通常的S/A标准的爆款数据量规模很少,通过模型拆分,我们可以引入一些半监督方法增强数据、构建模型。
我们使用的方法是把大模型拆成小模型,引入一个中间变量,下面给大家介绍是如何完成的。
我们的目标是给定一个x,返回一个y, y可以是爆款或非爆款(0、1),也可以是SABC(0123)。我们输入的x是vv值、点赞数、评论数、xtr指标等所有指标,在正样本很少的情况下,引入一个中间变量z,方便我们构建一些半监督数据。图片右侧列出了z的推导公式:给定x预估z的值,对所有z的可能性进行求和,再给定x和z的值,去预估y的值。给定一个x预估z的计算我们引入了高斯混合分布,ø、θi是超参,我们需要学习的是α,不同高斯分布的联合分布的权重。我们简化每个维度都用单独的一个高斯分布,最后给它简单地做一个权重型的线性累加。
中间变量z的作用在于我们可以直接定义z为播放量的分布,将原先单一的播放量映射到一个分布上去,实现软着陆,这样即便当前的播放量绝对值可能不高,但是它有一定的概率成长为高播放。
整体上我们的爆款识别流程如下:
将爆款内容魔法表情、模板、音乐、hashtag四种素材对应的所有视频特征,输入到爆款发现的粗召部分,之后通过小时级的粗召发现返回爆款素材列表,将素材列表输入到精排部分拿到原数据(赞评关转包括vv值),得到了所有的数据之后引入z变量,计算出z的值后,通过高斯GMM的混合模型,用最小二乘法学习不同的高斯模型的权重,最后过一个单层的DNN输出概率值。
04 案例实践与展示
最后和大家分享两个实践案例。
右边是平台去年12月份上线的冬日口罩,趋势图中黑点代表每小时冬日口罩的vv值,红点是我们使用前面介绍的整套逻辑框架后监测的真实概率捕捉的走势图,基本上红线会比蓝色黑色线靠前。具体来说,红色曲线在12月7日早上10点,出现了第一次尖峰,该素材在12月7日晚8点才出现了第一次vv的尖峰,我们提前了十个小时监测到了该爆点。
第二个例子是坠落星闪的特效。各项指标的代表意义同上。我们在2月2日晚上8点检测出现了第一次尖峰。而该素材在第二天晚上9点钟才出现第一次vv峰值,提前了25小时检测发现。
相关专利及参考文献如下,感兴趣的同学可以参考相关专利及文献。
05 精彩问答
Q:爆款素材挖掘出来后,平台会加以扶持,对于创作者来说,应该侧重哪些可以让自己的作品成为爆款?
A:如果一个视频的爆款概率、vv、用户参与度指标、视频质量和创新性都非常高,基本都会被平台捕捉到。有两种办法能够让视频满足上述特点,一个直接的方式就是多参与平台的活动,在发布视频时关联相应的hashtag。快手平台每天都会推出一些活动,用户关联平台推出的活动会被平台监测到,并给予一定的流量激励,这会更容易让视频出播。第二个方式是多发视频,平台非常关注创作者的发布热情,如果创作者有创作热情,但拍摄技术仍有待提高,可能平台会捕捉到这样的用户,直接联系该用户提供相应指导,帮助其拍摄出更好的视频。
Q:如果一个素材在前期没有出现高峰,可以预测出未来是爆款吗?
A:监测需要提前捕捉,我们使用爆款概率速度对爆款进行提前捕捉。原始视频增长很迅速,它在前期的数据表现平平,在后期才会出现毛刺,但它突然的上涨马上能被我们的爆款概率给捕捉到,落成一个特征。至于说它后期是否会有爆款的潜力,这就通过我们其他的速度去调和并且做结合。
Q:爆款识别模型的训练数据label是怎么定的?
A:给定了一个视频的时候,我们去看它一周的vv的表现,如果它这一周的vv值除以大盘的均值超过了我们预定的阈值,我们就会把它定义成一个爆款。比如说2021年6月1日某一个视频成为了爆款,我们可以把6月1日往前推三天,它在这72个小时之内的所有数据都是我们的正样本。我们通过这样的方式去构造它的正负样本。
Q:这里主要是对素材玩法层面的爆款识别?有考虑对单个视频使用爆款潜力的识别吗?
A:目前没有。我们要抓的爆款其实是以素材力度为出发点。监测单个视频太难了,平台方没有办法去控制某一个视频,但是它可以控制某一个素材,所以我们主要是针对素材的维度去识别一个爆款。
Q:视频爆款和冷启动有很大的关联,在模型建模的时候会考虑冷启特征吗?
A:暂时不考虑,冷启特征更多的是推荐团队监测,他们去做模型,给流量扶持,我们这边是做爆款捕捉的监测,还是以它的vv表现,以及一些用户参与度,包括视频本身的质量表现去做监测,没有考虑冷启特征。
Q:之前有提到的时效性特征有哪些?如何将这些特征融入到模型中?
A:这里的时效性是指视频的日龄,即视频发布时间,这些也会被vv捕捉到。因为推荐系统的现状,如果我们去观测vv,很多已经超过了时间的一些陈旧的视频或者素材是不会被我们捕捉到的。
分享嘉宾: