首发于Data Science
信息流推荐之EdgeRank

信息流推荐之EdgeRank

社会化推荐领域有一个比较新颖的话题:信息流推荐。像国外的Facebook、Twitter,以及国内的微博、人人、朋友圈等,都会显示好友的信息流。常规的信息流展示是根据News Feed(新鲜事)产生的时间逆序排列,已然是是个性化的了,但是里面的信息有些可能我们并不关注。所以,信息流推荐的主要目标是帮助用户挑选可能感兴趣的信息,过滤无效信息。

EdgeRank比较神秘,没有论文来具体描述,但是Facebook工程师 Ruchi Sanghvi 和Ari Steinberg在F8开发者大会上阐述过EdgeRank的基本思想。所谓Edge,是指当前用户关注的人或好友对其信息流产生影响的行为。权重定义如下:

其中,

u:表示当前用户与Edge创建者之间的亲密度

w:表示Edge不同类型的权重,譬如创建、评论、点赞、打标签等

d:表示Edge创建时间的时间衰减因素

简单说明:

1、Edge创建者与观察者的亲密度与近期交互有关。如果用户最近经常与某个好友聊天,经常访问其个人主页,两人之间的亲密度会很高;反之,如果两人很长一段时间没有交互,这个得分会很低

2、每种类型的Edge权重不同。根据优化目标看来看各个类型的关系,假设以提高用户在信息流中的点击量为目标,相对于点赞行为,评论行为可能与点击行为相关度更高。

3、时间因素的影响。社交网络中,越新的信息越有价值,越久远的信息价值越低。

从公式来看,EdgeRank考虑的更多的是人的因素,对内容本身考虑的较少,在以关系为主的社交网络中比较有效,但是感觉不太适合Twitter和微博这种媒体属性较强的网络。

笔者在国内某大型社交网络工作时,对news Feed以及内容聚合进行排序,会发现针对首页信息流的Rank,会导致信息时间轴的混乱,引起了用户的反弹。而且,如果我们的目标是强化用户在网站停留时间,以及用户交互量,信息流的排序其实有时候会起到反作用。将用户感兴趣的内容优先展示,会降低用户获取好友信息的成本,降低用户停留时间,但其实用户本身对好友信息是感兴趣的,也愿意去探索。

所以猜测Facebook的EdgeRank也许针对的是公共主页或机构,对朋友间的新鲜事其实影响不大。一方面很难猜到用户每一刻的感受,另一方面,机构和公共主页更容易以低廉的价格获取大量粉丝,若机构大量发布广告信息,不仅影响用户体验,而且Facebook很难挣到钱。Facebook的广告是夹杂在正常的Feed流中,与机构的Feed有很大的相似性,大量的机构广告可能会影响广告的收入。

发布于 2016-03-11 16:05