本书不仅全面地介绍了当下前沿流行的各式推荐算法,更多的是在阐释技术的同时把作者多年作为推荐算法工程师的工作经验和技巧融合进去,提升本书的含金量,给读者能同时带去技术和职场双重收获!
得到:
→中国图象图形学学会副理事长兼秘书长 北京科技大学计算机与通信工程学院副院长|马惠敏
→张枫
→Meta Principal Scientist |刘霁
→阿里妈妈展示及内容广告算法总监|姜宇宁(孟诸)
→北京大学计算机学院助理教授、博士生导师|王鹤
五位专家倾情作序推荐,每篇推荐序都是值得我们学习的推荐典范文章,既讲述了推荐的发展历史又阐明当下推荐趋势。
也得到了:
→抖音推荐负责人|刘作涛
→字节跳动前视觉技术负责人|王长虎
→快手推荐算法副总裁|周国睿
→清华大学博士|陈晓智
→AMD高级软件研发经理|李栋
→卡耐基梅隆大学博士后 Sea AI Lab 研究员|许翔宇
→旷视科技高级研究员|刘宇
→清华大学未来实验室助理研究员|路奇
→思谋科技总经理|苏驰
九位专家的鼎力推荐,诚心道出对本书的赞赏与评价,供读者品鉴。
总览篇
第 1 章 推荐系统概述 2
11 推荐系统是什么 2
12 推荐系统发展的天时、地利、人和 4
121 天时 6
122 地利 6
123 人和 7
第 2 章 现代推荐链路 9
21 召回、粗排、精排——各有所长 9
22 召回、粗排、精排——级联漏斗 13
23 打压、保送、重排——拍不完的脑袋 20
模型篇
第 3 章 精排之锋 25
31 简单“复读机”——逻辑回归模型 25
32 工业逻辑回归模型的稀疏性要求 29
33 FM 的一小步,泛化的一大步 34
34 多彩的 FNN/PNN/ONN/NFM 世界 37
35 高阶交叉 41
36 工具人 GBDT 45
37 嵌入表示亦福亦祸,树模型的新机遇 49
38 DNN 与两大门派,“一念神魔”与功不唐捐 53
39 再论特征与嵌入生成 58
310 机器学习唯一指定王牌技术——注意力机制 62
311 注意力机制的几种写法 65
312 Transformer 的升维打击 69
第 4 章 粗排之柔 72
41 粗排存在与否的必要性 73
42 粗排复杂化的方法 73
43 Pair-wise 与 List-wise 74
第 5 章 召回之厚 76
51 u2i 之双塔进击史 76
52 i2i 及 u2u2i 方案 81
53 近似搜索概览 85
531 向量量化类方法 86
532 基于图的搜索 87
54 树模型与类树模型的冲击 89
第 6 章 模型迭代的术与道 93
61 什么是“老汤模型” 93
62 模型迭代的“术” 96
63 模型迭代的“道” 98
前沿篇
第 7 章 用户兴趣建模 101
71 从百到万的用户长期兴趣建模 101
711 从百到千 102
712 从千到万 102
72 用户多峰兴趣建模 104
第 8 章 多任务学习 107
81 多任务学习的实践意义 107
82 多任务学习的基本框架 110
83 平行关系建模——MMoE 类方法 113
84 非平行关系建模,任务间的因果 117
第 9 章 非梯度场景 121
91 线上与线下的鸿沟 121
92 弱个性化 CEM,强个性化强化学习 124
93 探微参数与性能的关系,把点连成面 128
第 10 章 探索与利用 133
101 为什么要探索与利用 133
102 探索的本质是巧妙“贪心” 136
第 11 章 后精排环节 139
111 定义多样性问题,简单的形式与复杂的标准 139
112 DPP 算法与多样性 142
113 考虑上下文的重排序 144
第 12 章 推荐中的偏差与消除 147
121 各种各样的偏差 147
122 流行度偏差的消除 148
123 位置偏差的消除 151
第 13 章 自动机器学习技术 155
131 网络结构搜索与网络微操的探索 155
132 特征的搜索 159
133 模型压缩 161
第 14 章 图计算 165
141 数据结构的终极 165
142 GNN 的极简发展史 168
143 物料非原子化,建模转向图 171
难点篇
第 15 章 延迟转化 175
151 转化与广告机制 175
152 转化的分解 177
153 其他角度 178
第 16 章 物料冷启动 181
161 “多模态之石,可以攻玉” 181
162 预排序向左,个性化向右 184
163 流量分配,“普度众生”还是“造神” 188
第 17 章 用户冷启动 191
171 元学习,对模型拔高的要求 191
172 初始化的基底分解与生成 195
173 POSO,首个从结构角度改善用户冷启动的模型 197
174 精品池:抓住人性需求 201
第 18 章 因果推断 204
181 当分布不够用时 204
182 寻找“工具人”,将因果推断直接应用于推荐 209
第 19 章 长尾优化 212
决策篇
第 20 章 流量 218
201 重新认识流量 218
2011 流量区分快慢 219
2012 流量区分成本高低 220
2013 流量是盲目的 220
2014 流量是有“圈子”的 221
202 时间的研究 222
第 21 章 分层 224
211 你必须理解的物料生命周期 224
212 你必须理解的用户分层 228
213 三阶段让用户为我“死心塌地” 231
第 22 章 实验现象与回收 234
221 决策上线的黄金法则 234
222 “临门一脚”,结果真的置信了吗 237
223 不万能的 A/B 实验和难以归因的反转 239
224 线上和线下的对齐——无穷逼近 241
后记 243
参考文献 244