构建企业级推荐系统:算法、工程实现与案例分析
上QQ阅读APP看书,第一时间看更新

2.5.1 推荐算法工程落地一定要用到排序模块吗

工业上的推荐算法一般分为召回和排序模块,召回的作用是从全量标的物集合(几万甚至上亿个)中将用户可能喜欢的标的物取出来(几百个),排序阶段将召回的标的物集合按照用户点击的可能性再做一次排序。但是排序阶段不是必需的,特别是对于标的物池不大的产品及团队资源较少的情形,没必要一开始就开发出排序框架。召回算法一般也会对标的物做排序(如果是评分预测模型,如矩阵分解,可以按照评分高低排序;如果是概率模型,可以按照对标的物的偏好概率大小排序)。缺失了排序模块的推荐系统可能精准度没有那么高,但是工程实现上相对更加简单,可以快速落地上线。特别是对于刚做推荐系统的团队,可以让其系统快速上线,后面再逐步迭代,补全缺失模块。

其实在推荐系统中增加排序模块主要是出于两个方面的原因:一是标的物池太大,通过召回进行初选,这样候选集就小很多了,再通过复杂的排序算法(如深度学习算法)进行精选;二是将推荐过程拆解为两个阶段,以使工程实现上更加模块化,更加可控,人员分工也更加精细化。