百度短视频推荐系统的目标设计
作者:玉奇
导读:短视频产品最近两年蓬勃发展,百度旗下的短视频品牌-好看视频,人均使用时长70分钟,短视频播放量已超30亿,从推荐系统的角度考虑,如何设计一个推荐系统的目标,以及短视频迭代过程中沉淀的思考。
全文2433字,预计阅读时间 8分钟。
《2020年中国网络视听发展研究报告》显示,截至2020年6月,中国网络视听用户规模已超过9亿,短视频用户达到了8.2亿 ,这些用户平均每天花费近2小时 观看短视频。与此同时,百度旗下的短视频品牌——好看视频,人均使用时长70分钟 ,短视频播放量已超30亿 ,好看视频的海量内容也是搜索非常重要的供给方。
对于推荐类产品,内容是基石。那么好看视频的内容体系是怎样的?首先,在好看视频现有体系中,有着百万级内容创作者,在持续生产内容;这其中还包括10万+优质内容的创作者;同时,我们也在持续创作和输出自制剧,比如“越来越好看”、“你的生活好好看”等等。
一、推荐系统解决什么问题?
在推荐平台或信息流产品中存在3个角色:用户、创作者、广告主 ,推荐系统要解决的用户和创作者两个角色的体验问题:
1)用户端: 极致优化体验,满足用户千人千面的高度个性化消费需求。我们在百度系有丰富的用户画像和理解,同时在App内,可以对使用环境有感知、并以用户兴趣表达等信号为基础,进一步抓住用户的兴趣。
2)创作者: 让优质的内容得到更多的分发、留住创作者、实现内容优胜劣汰。另外配合生态层面的宏观调控,可以最大程度地保证优质的创作者在此平台源源不断的输入更多内容。
二、视频推荐系统的全貌
如下图所示,创作者将内容上传至平台后,会进入统一的正排流程;用户打开APP请求时,系统会把所有相关的内容召回(显示、隐式等),其宗旨是:“Make Everything Happens” ,然后通过粗排、精排、融合这三级漏斗,选出用户最喜欢的内容,最后通过机制调控呈现最终的内容。
三、视频产品交互形态下的用户兴趣刻画
用户打开APP后,推荐的视频就会自动播放,类似家里的电视机,打开就播放,喜欢就继续停留在此页面,不喜欢则划到下一条,在APP中这是一种新的交互形态,同时也给推荐带来了挑战:如何去刻画用户的画像?如何判定用户是否喜欢?
可以借鉴传统的点选式交互形态 ,即用户先判定是否感兴趣,若感兴趣则点开视频;满意则会持续看并播完;若不满意,用户可能会选择退出。在自动播放这种新的交互形态下,我们将这种不喜欢就划走的行为定义为“伤害”,将观看一条视频时间较长或者完全观看完的行为定义为“满意”。推荐系统将采用**(伤害、时长、完播)** 这三级信号来刻画用户的兴趣。
除了通过播放行为刻画用户兴趣外,关注、点赞、收藏等都是用户表达喜好的信号。在设计推荐系统的时候,要先理解产品,然后再去设计。对于短视频推荐系统的交互行为有如下信号,并将这些信号整理归类到下图四象限,并引入到推荐系统中。
四、多目标排序的应用
1)多目标建模
多目标建模从最开始基础的shared-bottom的DNN建模发展到MMOE,最后采用分人群MMOE ,将N个推荐系统目标建模出来,在真正实现的时候,低、中、高三种活跃度专家分别训练,联合决策防止高活人群样本主导整个模型,从而保证系统的准确性。
2)多目标融合排序
通过模型预估N个多目标后,需要将这些多目标融合到一起,常见的方法是做简单的多项式融合,这种是比较基础的方式,简单有效且易引入经验值。但缺点也很明显,需要经常调整且不能自适应。而现在发展到使用deepES的方式,即分场景个性化融合,每次通过扰动模型内部参数获得多组参数组合,然后根据设计的Reward来选择最优的参数;其特征引入设备类型、状态、刷新节奏等多种状态,逻辑图如下:
五、长期受益目标的推荐系统
前面讨论的推荐目标都是根据当前即将推荐出视频的消费情况来排序的,但我们把视角移到更长的时间序列上来。用户的消费分为过去、现在和将来三个阶段。对于过去的内容,可以把它当成模型训练的样本、刻画用户兴趣的特征。当下的推荐目标是:对于未来可能消费的内容,本质上是当前兴趣的“延续”;而当前兴趣可以看成对未来兴趣的“激发”,将未来消费内容价值归因到当前视频上,即未来长期价值(Long Term Value)。
通过下图方式设计LTV,举例:用户今天看到一个脱口秀视频的价值定义为V0,假设未来用户还会看此类视频V2、Vn,那么我们可以将V2、Vn的消费时长和消费价值归因于当前的V0,具体设计分为2步:1、找到相关内容、设计衰减因子;2、用模型拟合LTV。
六、视频推荐系统多目标的探讨
1)多目标的价值是否相同?
比如用户关注一个视频和给这个视频点赞,或者视频的第1个赞和第10个赞的价值一样吗?
2)当前的目标是群体最优的吗?
所推出的视频被播放会产生协同价值吗?当前视频若对该用户价值不是最大,但对整体价值最大,可以推荐出去吗?
3)能否去设计一个目标、系统、模型去刻画用户的留存?
多目标设计、以及未来收益设计,我们的目标都是提高用户留存度。是否可以直接构建用户留存率模型呢?
以上都是值得同学们深入思考的问题,有机会我们可以一起交流讨论。