聚合类中的黑马今日头条,是如何实现用户与内容的精准连接?
机器深度学习逐渐成为互联网的焦点。信息大爆炸的时代,如何将碎片化阅读与机器学
习完美结合,实现个性化内容信息的分发?本文将以另一种视角解读分析“聚合类信息平
台的巨头”——今日头条。
一、今日头条的产品简介
1. 产品定位与介绍
今日头条是互联网连续创业者张一鸣于 2012年 3月份创建,一款基于数据挖掘的推荐引
擎产品,为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务。
2. 市场分析
于 2012年 8月发布第一个版本,截止 2016年 8月底,今日头条目前拥有超过 亿的装
机用户,月活跃用户超过 亿,日活用户超过 6000万,每个用户平均每日使用时长超
过 76分钟,人均单日启动次数远超其同类竞品。
随着移动互联网人口的红利消失,网民人数已经区域饱和的趋势下,产品越来越重视用户
的使用时长数据。用户使用时长移动应用排名中,今日头条已经排到 11位,紧随手机淘
宝之后(top20中腾讯占了 7成,第一和第二分别位微信和 QQ)。
3. 今日头条——张一鸣
每一款产品的发展都会或多或少都会收到创始人的影响,我们通过了解其创始人的背景,
希望能对产品有更深入的了解。
张一鸣,今日头条创始人,现任 CEO。
2005年,南开大学毕业加入酷讯。加入酷讯之前曾有过短暂的时光和师兄创业。
加入酷讯后,两年的时间从一枚普通的程序员进阶为技术开发总监(这段经历张一鸣在篇
文章“最看好年轻人的五个特质”中有详细描述,感兴趣的同学可以看看)。
2008年,加入微软同年离开并以技术合伙人的身份加入社交网络校内网和饭否。
饭否关闭后创立了中文房产搜索网站九九房,九九房当时已成为第三大房产信息网站,并
在移动领域同类应用中遥遥领先。
2012建立了字节跳动科技有限公司即今日头条。
总结起来,就是不断的创业,不断的颠覆自己,去做自己想做的事情。他创建今日头条之
前的一次创业已经成功。因为在饭否和王兴(美团 CEO)一起创业,所以不断的有媒体把
他们两个一起比较。
相传张一鸣在坐地铁的时候用报纸读新闻,而周围的人都用手机看新闻,意识到移动互联
网的到来,我们处在信息大爆炸的时代,获得自己想要的信息,成本却是越来越高。以此
创建了今日头条。
二、今日头条的产品分析
如何成长为聚合类 APP中的一匹黑马?
如何将“个性化”阅读做成行业竞相模仿的标杆?
如何实现用户与内容的精准连接?
头条拿到用户的行为数据后,会对用户做个简单的模型分析,建立标签树对内容主题等提
取分类,按照用户的标签推荐给用户,实现个性化推荐。
个性化推荐的三要素:用户,模型,内容。
1.界面分析
如何将信息最好的方式展示给用户,提升用户体验?
今日头条放弃直播,将短视频放到第二个入口,个人认为是因为短视频内容更适合控制和
做分发。此外直播对网络环境的要求较高,因此短视频更有优势。
如何拿到用户更多的行为数据?
在客户端拿到更多的用户行为数据,才能给用户建立更完善的标签,推送的内容才能更准
确,那么今日头条对用户行为数据的采集做了哪些努力?
(1)引导用户登录
只有完整的账号体系,才能给用户建立系统的模型,新闻客户端的产品特性决定,用户在
不登录的状况下也能正常使用,今日头条在引导用户登录做了很多文案方面的刻意引导。
(2)获取用户对推荐问文章的正负反馈,建立完整的模型提示
今日头条的界面有个很明显的特征,每篇文章右下角有个小叉号,用户点击可选择理由,
屏蔽相关文章;
短视频界面,用户点击右下方,选择不感兴趣,可屏蔽相关视频类的推荐;
通过以上两种来获取给用户推荐精准与否的负反馈,优化自己的推荐算法。
同时头条将分享,评论,收藏,关注文章作者的头条号功能摆放的比较凸显,甚至在某些
文章的下面增加打赏的功能。今日头条不只局限于新闻资讯 APP,不断的拓展自己的边
界,打造成一个推荐给用户喜欢的所有内容的平台,引导用户自主的转发,评论,收藏,
关注获取用户的更多的行为数据,来判断用户对推荐文章的喜好。
(3)频道推送,头条号,社交因素
在首屏,频道类根据热门频道,和用户自己主动添加的频道给用户推荐,当然根据频道推
荐在传统的新闻客户端的比较重要,今日头条的推荐算法中的占比并不大,让用户主动选
择是有成本的,同时有些文章很难按照固定的标签划分。
头条开创头条号后,在文章和短视频中,开始主推自己的头条号,同时在关注中有各种类
型的头条号可供用户选择。根据用户关注的作者的头条号,为用户推荐类似的内容,拓展
用户的阅读范围。
头条也在不断的尝试社交,来增加用户的粘性,获取更多的用户社交数据,例如同步通讯
录好友,关注明星等大 V的头条号(有点类似于微博的味道)。同时头条也在开创头条问
答的社区,在社区社交方面,可以看到头条也在做不断的努力和尝试。
2.个性化推荐模型分析— 如何做到个性化推荐,实现内容与用户的精准连接
用户模型的建立—用户喜欢什么?
(1)新用户—冷启动
新用户登录之后,并没有任何行为数据,如何给新用户做个性化推荐?
当新用户加入时,一般需要给用户一个初始兴趣值今日头条选择了冷启动的解决方案——
通过对用户微博账号的分析建立一个“兴趣图谱”,即根据用户在微博上发布的内容及其
所属类别、用户自标签、社交关系、社交行为、参与的群组、机型、使用时间等来数据源
来推断出用户的兴趣点有哪些。社交关系、社交行为即用户和用户之间的交流状况,可以
根据二者间的共同好友数、相互评论熟、@数等来做度量。
(2)根据用户的行为数据,完善模型
通过用户对推荐的文章,视频。评论,分享,收藏,点赞,屏蔽来获取用户的正负反馈数
据,不断完善用户的模型,画像。
(3)协同过滤
基于用户的写通过率推荐算法先使用统计技术寻找与目标用户有相同喜好的邻居,然后根
据目标用户的邻居的喜好的文章,向目标用户推荐。基本原理就是利用用户行为的相似性
来互相推荐用户可能感兴趣的文章。
(4)环境特征
根据时间,地理环境特征为用户推荐不同的文章。例如用户早上和晚上想读的文章肯定不
一样,在办公室和家里想读的文章也有区别,用户的地理环境特征比较难获取,这也是头
条个性化推荐的一个短板。
内容的分发—哪些内容适合推荐给用户
创作者产出一篇文章,会经过层层筛选,然后推荐给需要的用户
(1)机器去重。
(2)文章主题分类。
使用自然语言处理和图像识别技术对每条信息提取几十个到几百个高维特征,并进行降
维、相似计算、聚类等计算去除重复信息;对信息进行机器分类、摘要抽取,LDA主题分
析、信息质量识别等处理。
(3)热门文章与新文章的平衡
给用户推荐新文章还是热门文章,两者之间要做一个评估,既让用户能看到热门文章,同
时让新的文章也要有机会接触到用户。
3.内容的来源
今日头条有别于传统的新闻客户端,并没有自己的编辑部门,前期的内容都是靠爬虫抓
取,当然在今日头条创建初期的时候,这样会给传统的新闻客户端带来一部分的流量,也
不至于形成直接的竞争,这些传统的新闻客户端也乐见其成。后期头条逐渐做大,带来的
更多的版权问题。在内容创业盛行的大趋势下,今日头条推出头条号,投入 2亿基金大力
扶持平台原创内容,弥补内容质量短板,打造互联网创作的第一平台。同时抓住短视频内
容创作的风口,投入 10亿大力发展。
三、总结
分析完头条的产品模式,我们再来总结下头条为什么能获得今天的成功。
1.技术的优势和清晰的产品定位
今日头条在推出之前,张一鸣团队就推出过头条段子等一系列的产品来验证用机器学习做
内容信息分发的可行性,之后推出今日头条并迅速获得成功。
头条不同于传统的新闻客户端,是款聚合类信息的 APP,连接的人与信息,这有点类似于
百度,依赖流量变现。
2.头条 APP不断的尝试获取用户更多的数据,通过机器学习不断扩容大数据库构建自己的
壁垒
头条在产品界面,如何获取用户的行为数据,正负反馈。做了很多尝试,并通过机器学习
不断的完善自己的大数据库,优化模型分析,建立起自己的技术壁垒。
3.开始发力弥补自己内容原创质量不足的短板,头条号已经取得不错的效果
说起头条不得不说的的一个就是头条号,头条号自创建以来,已经取得不错的成绩,弥补
自己的原创内容不足的同时,也为自己重新建立了一道护城河。
四、个人建议
1.文章,视频的内容质量有待提高。
头条推荐给用户的东西仍然给人低俗的形象,这也影响着头条的发展。标题党,大尺度的
图片等成为用户不断吐槽的点,大尺度照片是头条自己内容质量的短板的问题,是用户自
己选择的结果。也同时不排除头条刻意推荐给用户这些图片,提高用户的使用时长,毕竟
流量才是头条的目前变现的方式。
2.个性化推荐并不是很精准(增强用户环境特征的挖掘,允许用户自贴标签)。
3.作为新闻资讯类的产品,新闻时效性比较差(头版区域设置新闻专栏,增强热点新闻的
推送)。
4.在社交上可以做更多的尝试,比如建立兴趣小组等。
以上内容纯属个人兴趣整理,个人拙见,有看法相左的,欢迎随时讨论。