徐一龙:把今日头条等同于算法推荐,是四五年前的认知了
时间:2019-11-19 11:24:20 热度:37.1℃ 作者:网络
一、头条=算法+热点+关注+搜索
很少人知道,现在互联网寻人非常高效的系统——头条寻人,最初就是今日头条一个日常弹窗运营动作。
今日头条的弹窗,有部分内容是针对本地用户,给本地用户弹窗本地资讯。2015年中旬,今日头条尝试将寻人启事也做本地推送——只是这个本地更精准,取走失者周边几公里。
最初,我们预期用这个方法帮助寻找走失的儿童,没想到儿童走失的案例非常少,而且即便推送出去的,也没有一例成功。到2016年春节,就在我们犹豫要不要放弃的时候,我们意外发现,偶尔我们推送的一条寻找走失老人的信息,居然成功了。
我记得,这是2016年大年初二的事情。后一鸣知道了这事儿,他说,这事有价值,当成一个长期项目做吧。
后来的事情很多人都知道了。一个公益项目,从2016年大年初二整装出发了。头条寻人,基于LBS技术,从寻找走失老人开始,逐步扩充到精神病患者走失、寻找紧急住院无名患者家属、寻找台海老兵遗属、寻找烈士遗属,三年过去,已经找到帮助超过1万个离散家庭破镜重圆。
我讲这件往事是想说,把头条等同于算法,至少是四五年前的偏见了。写这篇文章,就是想从传统媒体人的角度,谈谈今日头条在7年时间里,是如何搭建一个包括“算法+热点+关注+搜索”在内的通用信息平台的。
2015年1月,我履职今日头条副总编辑,参与内容运营的工作。在此之前,我在传统媒体工作了15年。来今日头条前,我不但不了解“算法”,对“推荐”这个词也很陌生——传统媒体,是很少使用“推荐”这个话术来描述业务的。
为什么?我的理解是,“算法”、“推荐”的业务场景都是处理海量资讯。我曾经在电视台、报社、杂志社工作,生产的内容其实都很有限,一份报纸最多也就千余条新闻,媒体界用“头条”、“头版”、“封面”,就可以解决现在资讯APP瞄准的“推荐”问题。而类似今日头条仅每日新增的内容,就有几十万篇文章,如果没有“推荐”,那可是彻底乱套了。
所以,什么是“推荐”呢?我的理解是:面对海量内容时,如何帮助用户高效地选择、消费内容。
来今日头条后,我这个文科生也对“算法”有了粗浅的了解,对更多内容行业观察者来说,今日头条甚至普及了“算法”这个概念:通过个性化推荐技术,用户可以看到自己感兴趣的内容,这后来也成为了全球范围内几乎所有内容平台的标准配置。但是,今日头条的推荐策略其实并不只是“算法”。
2012年8月上线至今,今日头条历经了7次大的版本更新,并在这个过程中,演化成一款日活过亿的国民级产品。今日头条的推荐策略,早已不依赖于“算法”,而是一个囊括了“算法+热点+关注+搜索”等多种功能的通用信息平台。
热点、关注、搜索……这些功能陆续推出的背后,其实是今日头条在不断完善自身的推荐策略。在我印象里,有三个比较重要的节点。
第一次,是2015年要闻区的设立。2015年1月,头条的推荐频道,已经有了要闻区,但是这个要闻走的是“加权推荐”的策略,不保证每个用户都能看到。当时我刚加入公司,基于传统媒体人对重大新闻的判断,我提出了入职后的第一个产品需求:“重大新闻应该让每个用户都看到”。靠算法起家的产品经理和工程师们,也认为这个需求很合理。因为他们也发现,每当发生重大新闻,头条的DAU就会提升,算法可以让用户看到自己喜爱的内容,而重大新闻则有“穿透性”,如热刀插黄油般,可以轻易穿透个性化——即便不关注科技的用户,也会关注孟晚舟女士在加拿大的遭遇。现在,“要闻”的演进更成熟了,仔细观察下现在的头条首页,会发现整个页面可以分为四个区域,第一块是搜索区,第二块是频道区,可以看到各种垂类信息,第三块是要闻区,权威媒体的重要新闻,第四块是个性化区,用户可能感兴趣的内容。我们希望能够通过这样的改进,同时满足用户对于个性化资讯和了解新闻热点的需求。
(图说:今日头条产品内容示意图)
第二次是2017年微头条和问答产品的推出。我们通过这两种全新的内容体裁,探索智能社交,包括:上线问答频道并推出独立产品“悟空问答”,一个为所有人服务的问答社区;上线“微头条”,让所有头条用户,特别是普通人通过发布短内容,与人互动、建立关系。这是头条从算法分发走向社交分发的初步尝试,我们希望用户在头条内能建立起有效的社交关系。与此同时,内容可以通过“关注”的形式来分发,而不是仅仅依赖于算法。所以我们在产品上也做了改变,今日头条客户端第一栏(最左边)就是关注频道,用户可以在这里实时查看自己关注用户的动态。此外,用户在刷推荐频道时,也能够随机刷到自己关注的亲戚朋友或名人明星的动态。因为工作的关系,我在头条上关注了很多名人、作者和朋友。我会发现,“关注频道”对我吸引力越来越大了,甚至能媲美“推荐频道”,这就是关注分发的魅力。
第三次是2019年头条搜索的推出。最近,我们推出了全网搜索的功能。这是今日头条“信息创造价值”理念的延伸。用户可以通过今日头条最上面的搜索框进行搜索,查询站内外的信息。我本人也一直频繁使用头条内的搜索,坦诚说,最初效果并不太好,但最近,它越来越能满足我搜索的需求了。而热点运营工作,也延伸到搜索去。每当发生重大新闻,运营人员也会去优化搜索结果页,让人们能看到重大新闻最重要、最新的进展。
二、算法不制造信息茧房,而是探索兴趣
在互联网时代,人通过上网获取信息,主要有四种途径:一是门户网站,二是搜索引擎,三是社交,四是算法。
门户网站的特点是人工编辑筛选,把所有新闻列在首页,缺点是容量有限,一天顶多更新几百篇稿件,用户也不会每条都看。而像今日头条,内容池是上千万篇文章,能够提供的信息量要丰富得多。
搜索是人主动获取信息,但要在海量的搜索结果中,逐个仔细筛选出自己想要的,占用时间比较多。即便搜索结果也不断被优化,搜索时,“找内容”的过程仍然要占据大量时间。
社交等于关注和订阅,由本人选择,按自己需求出发。但一个人往往是相信什么或者喜欢什么之后,才会选择关注什么。比如我家人相信健康养生,就关注健康养生的作者,带来的问题是难以突破认知。
(图说:从互联网获取信息的方式很多,融合起来是最好的方法)
有人说算法会造成“信息茧房”。这是对算法最大的误解。
“信息茧房”概念,来自于哈佛大学法学院教授凯斯·桑斯坦。他在《信息乌托邦——众人如何生产知识》一书中指出,在信息传播中,因公众自身的信息需求并非全方位的,公众只注意自己选择的东西和使自己愉悦的通讯领域,久而久之,会将自身桎梏于像蚕茧一般的“茧房”中。
为什么我说算法不会制造“信息茧房”?
首先,算法在推荐时,除了用户现有的个人兴趣,还会基于使用环境、内容热度、其他用户的兴趣,来给用户推荐信息。这些因素能够让推荐内容更加丰富,避免了内容越来越窄。
其次,算法本身还包括兴趣探索。
一般人对算法的认识:喜欢什么,就推什么。可人生是漫长的,人的兴趣不但是各种各样的,也不断变化的。比如,我是英超球队阿森纳的铁杆球迷,可最近几年阿森纳每况愈下,实在心生疲惫;在体育内容上,最近一年我就更关心乒乓球,尤其是“日本选手张本智和和伊藤美诚多大程度上可以挑战中国乒乓球运动员”,就比“阿森纳能不能排名英超前四”更让我关注了。
算法如何做这样的兴趣探索呢?寻找这个问题的答案,也是我来今日头条后,想要探索的一个“新兴趣”。
在向公司的技术大拿同事求教后,我了解到,算法最有效的能力,是识别出你最感兴趣的内容和最不感兴趣的内容。在二者之间,还存在一大块“你可能感兴趣的内容”,这些内容绝对不会被工程师和产品经理们放弃。事实上,每个人的成长也是不断地将“可能感兴趣的事情”,固化为“确定感兴趣的事情”和“确定不感兴趣的事情”的过程。
对于算法如何识别人们“最不感兴趣的内容”,算法推荐里专门有个名词叫“协同过滤”,英文术语叫collaborative filtering。“过滤”是“推荐”的反义词,也是“同一个事情的两个方面”。算法有很强的能力,过滤掉那些你明显不感兴趣,跟你一点关系都没有的东西。比如我根本不关注美妆、口红方面的内容,算法没必要推荐这些内容给我。
那么算法如何去探索那些人们“可能感兴趣的内容”呢?
用户兴趣泛化和窄化,其实是推荐系统中的经典问题,学界和业界一直很重视。这个问题叫EE(Exploitation Exploration):Exploitation是利用,通过已知的比较确定的用户兴趣,推荐相关的内容。Exploratio是探索,除了推荐给用户已知的感兴趣的内容,还需要不断探索用户的其他兴趣,避免推荐结果一成不变。
算法追求的是,尽可能地满足用户获取有价值信息的需求,并且让用户获取信息的价值最大化。
(图说:就像开宝箱一样,算法需要通过探索来发现用户的兴趣)
我们的工程师大拿说,兴趣探索在短期内会减损用户使用时长,因为用户会在信息流里刷到不那么感兴趣的内容,觉得信息流很乱。但是如果不做兴趣探索,短期内可以提升点击率,但这个提升效果会迅速衰减,因此从长期看收益是负向的。
所以,兴趣探索并非算法的“锦上添花”,而是“必不可少”。
这下你可以理解,“算法就是喜欢什么就推什么”是一个多么“天真”的误解了吧。
三、人是万物的尺度,也是算法的尺度
当然,任何事物都不是完美的,算法也有一定的局限性。所以,需要一些其他手段,来帮助信息更好地流动。
在今日头条,我们在内容运营方面,主要做两个事情:一是帮助头条获取更多优质来源;二是确保优质内容在头条上获得合理的阅读比例。
算法再精准,兴趣探索再成功,如果内容池的内容不够优质、丰富,那推荐做得再好,也不会让用户感受好。所以,从一开始,我们就非常重视优质内容。2015年,头条率先推出“千人万元计划”,对1000个优质作者,给予每个月1万元的保底补贴。今年又推出了“创作者收益计划”,希望帮助1万位创作者月薪过万,让优质创作者获得更多收益。
公平并非一视同仁,一篇公司调查和一篇娱乐八卦,前者付出的心血多,而流量往往低于娱乐内容,而平台这时候,就该勇于去“拉偏架”。“拉偏架”不但体现在资金扶持,也体现在流量扶持上。
有些优质内容,它们不一定能引起所有用户的兴趣,也不能单纯从用户行为习惯来判断,无法被推荐系统直接有效地衡量。这个时候就需要人介入。
一方面,我们调整机器推荐权重,比如给优质来源的优质内容更多推荐权重;另一方面,我们优化产品机制,提供双标题、双封面,帮助创作者提升推荐效果。此外,我们还投入专门的人力,想办法帮助优质内容获得更好的分发和阅读体验。我们专门有一个团队就叫“作者体验”。
举个例子。2017年10月,今日头条和《三联生活周刊》达成战略合作后,我们为《三联》量身打造了封面专题的分发方式。封面专题是《三联》的特色,一个专题往往由四到六篇文章组成。在手机信息流中,专题的阅读效果其实不如单篇文章,但是,如果这些文章被拆开、打散,作为一个专题的阅读价值就会降低。后来,我们想办法让《三联》专题在头条信息流里,同时拥有两种分发方式,既可以被单条推荐,也可以以专题的方式被推荐。用户把每个专题收藏起来,就可以看三联周刊的所有封面报道。最新一期的封面报道《老友记》最近上线了,在今日头条内搜索“三联生活周刊”就能找到。
(图说:三联生活周刊的封面报道,在今日头条内会打包成专题推荐,也在搜索中做了优化,帮助用户快速获取。)
我入职今日头条后,经常有媒体圈的老朋友问我:一龙,你在头条干什么啊?头条不是都靠算法吗?
看,这两个问题,本身就是矛盾的。如果头条都靠算法,那我在头条真的没事可做了。而事实是,我在头条挺忙;头条除了算法,还有很多人。
我们始终相信人对于优质来源和优质内容的鉴别力。人的判断不同于机器,但同样值得被重视。技术更快,面对海量的信息,分发效率尤其重要;但人更准,特别是进入模棱两可的地带,人的同理心和想象力能够发挥重要作用。
无论是人还是技术,其实都只是一种手段,都是希望最优质的信息,能又好又快地触达到需要的用户手里,让人找到信息,让信息找到人,消除用户“早知道就好了”的遗憾。
不久前,有同事发给我一个脑科学专家的言论。大意是说,要打败推荐算法,需要两个因素:1. 你需要有追求高品质内容的需求。2. 你需要随机取样人类各个领域的知识。
其实,算法追求的,和这位专家追求的,一点也不冲突。因为,说到底,算法的目标是由人设定的,算法的内核,和优质内容、多样性并不对立。这也是今日头条一直以来努力的方向。
而这位专家所需要的“因素”,在作为通用信息平台上的今日头条上都有。
如果只有算法,绝不会有头条寻人;如果只有算法,今日头条也不会长期保持成长。
“让上帝的归上帝,凯撒的归凯撒。”人类其实没必要打败算法。一定要和算法分个胜负,大概是人的虚荣心和傲慢在作祟。比如在围棋领域,我们没有必要一定要追求打败阿法尔狗。
算法在效率方面确实胜过人,而人的同理心和想象力高于算法。我们应该做的是,和算法相互学习,做好分工。毕竟,参差多态,乃幸福之源。(李经)
文/今日头条副总编辑 徐一龙
张楷欣