大家的AI
机器学习AI论文
加载中…

学习

🏅我的成就

Ch.12

协同过滤:推荐系统基础

你在 Netflix 上见过「为你推荐」吗?协同过滤会根据与你口味相似的其他用户的高分项来推荐。本章从评分矩阵、相似度、近邻预测的概念到公式,再到实际应用,循序渐进地讲解。

按章节的机器学习图示

选择章节后,下方图示会切换为该章节内容。可一览机器学习脉络。

由用户×物品评分矩阵找出相似用户(近邻),用其评分预测空白格。

① 找近邻 → ② 参考其评分 → ③ 预测空位 → ④ 推荐近邻对此作品的评分 → 填入我的预测评分近邻1★ 5此作品?近邻2★ 4평균 계산相似用户给此作品 ★5、★4 → 平均推荐 ★4!
平均预测: r^u,i=5+42=4.5≈4\hat{r}_{u,i}=\frac{5+4}{2}=4.5\approx4r^u,i​=25+4​=4.5≈4(近邻给出了 ★5 和 ★4)→ 预测 ★4

协同过滤:由相似用户预测 r^u,i\hat{r}_{u,i}r^u,i​。

推荐基础:协同过滤

什么是协同过滤? — 利用其他用户的行为(评分、点击、购买)来为你推荐。直觉是「口味相似的人喜欢的东西也相似」。广泛应用于流媒体、电商、音乐等。
直觉:借用近邻的选择 — 例如电影推荐:若与你在 A、B 上打分相近的人也给 C 打了高分,你可能也会喜欢 C。这些「相似的人」就是近邻,用近邻的评分做预测是协同过滤的核心。
数学表示:评分矩阵与预测 — 用户 uuu 对物品 iii 的评分记为 ru,ir_{u,i}ru,i​,评分矩阵大小为(用户×物品),很多格是空的(稀疏)。基于用户的协同过滤先找用户 uuu 的相似近邻 NuN_uNu​,再对未评分物品 iii 用近邻评分的加权平均得到预测 r^u,i\hat{r}_{u,i}r^u,i​。相似度常用余弦相似度或皮尔逊相关。
实际与局限 — 冷启动(新用户/新物品没有近邻)、稀疏性使纯协同过滤受限,常与基于内容或矩阵分解结合。
推荐是业务与体验的核心 — 好的推荐能提高转化与留存。协同过滤仅靠行为数据即可做个性化,无需丰富元数据。
机器学习的重要应用 — 推荐不同于分类/回归,是「填矩阵空位」的问题。理解协同过滤是后续矩阵分解、深度学习推荐的基础。
基于用户 vs 基于物品 — 基于用户:找与你相似的用户,推荐他们喜欢的。基于物品:找与当前物品相似的物品(「买了这个的人还买了」)。都依赖相似度与近邻。
相似度与预测式 — 先算用户间相似度 su,vs_{u,v}su,v​,预测用近邻评分的加权平均。评估常用 MAE、RMSE。
矩阵分解(MF) — 进阶做法用低秩矩阵乘积近似评分矩阵;混合系统会结合协同过滤与内容/上下文。
本章介绍了推荐系统的基础协同过滤。
- 协同过滤:利用其他用户的评分、点击、购买等行为数据,找到与自己口味相近的近邻,用其评分预测空白(未评分)格。
- 评分矩阵:行=用户,列=物品。一格=「一个用户对一个物品的评分」。多数格为空,即稀疏矩阵。
- 预测流程:计算相似度 → 选出 K 个近邻 → 用近邻评分的简单平均或加权平均(以相似度为权重)得到预测值 r^u,i\hat{r}_{u,i}r^u,i​。
- 实际应用:常与基于内容、矩阵分解、混合方法结合,以应对冷启动和稀疏性。