打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
今日头条用了哪五种推荐算法?资深架构师曹欢欢首次公开揭秘

1月11日,今日头条在总部举办了一场推荐算法交流会,因为报名人数远远超过了预期,交流会还临时换了场地。

据介绍,阿里、腾讯、百度、美团、新浪、网易等科技公司的算法工程师和产品经理都去了。看来大家对今日头条到底用了什么推荐算法,那是相当的好奇。

在当天的交流会上,今日头条资深算法架构师、中国科学技术大学计算机博士曹欢欢带来了题为《让算法公开透明》的分享,首次面向行业公开算法原理。

今日头条资深算法架构师曹欢欢讲解今日头条算法原理

他表示:“算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型。希望这次分享能让更多的人理解算法,并共同参与到算法模型的制定中来,以改善算法,更好的为用户服务,让算法为社会创造更大的价值。”

据曹欢欢介绍,今日头条旗下几款产品都在沿用同一套大的算法推荐系统,但根据业务不同,每套系统的架构会有所调整。

曹欢欢在现场的PPT里公布了头条使用的五种推荐算法,包括传统的协同过滤模型,监督学习算法Logistic Regression模型,基于深度学习的Factorization Machine,以及DNN和GBDT。

曹欢欢介绍说,现在很难有一套通用的架构模型适用于所有的推荐场景,所以很多公司会做多个算法的组合,比如现在很流行将LR和DNN结合,甚至前几年Facebook也是将LR和GBDT算法做结合。今日头条也基本是一套大算法,根据业务不同再具体调整结构。

在解释了算法之后,曹欢欢进一步解密了头条的推荐如何工作。曹欢欢表示,主要有四类最重要的用户特征,将会输入给算法,影响到推荐算法的工作。

第一类是相关性特征,就是评估内容的属性和维度与用户是否匹配。显性的匹配包括关键词匹配、分类匹配、来源匹配、主题匹配等。像FM模型中也有一些隐性匹配,从用户向量与内容向量的核心距离可以得出。

第二类是环境特征,包括地理位置、时间。这些既是bias(基础)特征,也能以此构建一些匹配特征。

第三类是热度特征。包括全局热度、分类热度,主题热度,以及关键词热度等。热度信息在大的推荐系统特别在冷启动的时候非常有效。

第四类是协同特征,它可以在部分程度上帮助解决所谓算法越推越窄的问题。协同特征并非考虑用户已有历史。而是通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力。

分享过后,曹欢欢在还解答了各位对算法的疑问,包括今日头条如何实现冷启动,广告和内容该怎样平衡,怎样准确地拓展用户兴趣图谱等切实的工程性问题。同时,也听取了大家对今日头条算法的意见和建议。

更多内容36氪还会陆续放送……

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
抖音最新日活超3.2亿,字节跳动资深算法架构师深度解剖抖音推荐机制
36氪首发 | 今日头条推荐算法原理全文详解
AI 领域最最稀缺的人才——人工智能架构师
洪大宽:快手运营指南2.0
微信尝试结合时间过程与内容特征,重新定义“爆款文”?
西瓜视频怎么运营,如何获得高推荐高流量?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服