今日头条的算法规则主要来源于用户偏好及你的阅读信息进行推荐,但是头条的大众群体的口味也并不是那么高大上,这个时候有人担心低俗死循环的狭隘算法。随着头条的数据规模不断增加,对于用户兴趣标签的更新,现在是以分钟为单位,随时更新变化。
如果推荐十条同类内容,用户点击五条,机器就会认为你非常喜欢这类的内容。如果下次再推给你十条,你只点击了三条,那么机器下一次只会给你推送五条,这是一个实时动态调整的过程。头条还会根据用户的反馈,以实现更精准的内容推送。
不仅如此,头条的内容还分成个人兴趣,公共兴趣,探索兴趣。公共兴趣也就是热点兴趣,是在头条合作的媒体的生产内容当中抓取全网热度最高的文章,推送到热点频道上。热点的参考依据就是全网的报道量和转发量。热点的推送是实时的,并不受个人兴趣所影响。
头条不仅在内容上有个性化推荐,针对push,同样有个性化的算法要求。睡前是发push的高峰期,在一线城市,一般都是10点之后。新世相这样的公众号,内容推送时间更是定在了凌晨12点整。三线城市不一样,他们入睡时间往往需要提前两个小时,push要在9点之前出来。
头条的push除了实现内容的个性化之外,还会针对地域去进行个性化时间推送。不仅如此,它还会针对每个人对push的接受程度不同,个性化地调整push的推送频率。通过这套已经收集4年用户数据,越用越聪明的推荐引擎,头条完成了对内容处理的关键点,就是实现了对内容的筛选和分发,内容真正去中心化。
现在头条已经非常骄傲地在应用介绍中写道,5秒算出你的兴趣,定制你的专属资讯,你的每一次顶踩、收藏、转发,都形成个性化用户数据,被头条记录学习,每日400位工程师精心优化算法,只为每一次推荐都更加精准。在头条这里,挑剔的用户个体已经形成了一串串精准的数据。
所有的推荐引擎都会面临一个问题,就是产品的冷启动。产品前期是没有数据积累的,头条是如何进行产品的冷启动呢?在头条CEO张一鸣确定了要做个性化推荐的产品方向后,他需要进行MVP,开始投入市场去实验产品定位是否成功。
头条先拿图片试水,第一款产品叫搞笑囧图。在这款App积累了一定用户之后,在2012年的5月份,先推出了一个实验性的产品,叫内涵段子,尝试了图片到短文字的一变。这款App跟今日头条现在的技术架构已经一模一样了,只是推送的内容不同。
在这款产品收到不错的反响后,张一鸣在8月份推出今日头条,内涵段子也相应成为了其中的一个搜索分类,冷启动时候的数据也是通过内涵段子的粉丝倒流进去的。大家可以看到,现在的界面也是有一定的相似之处。