What is machine learning?

Machine learning learns patterns from data to make predictions. Start with https://mdooai.com/zh/learn/ml/mlSupervisedUnsupervisedSelf.

What is the difference between ML and DL?

Deep learning is a subset of machine learning focused on neural networks. Build foundations at https://mdooai.com/zh/learn/ml/mlDataFeature first.

Use cross-validation while narrowing search ranges. Start at https://mdooai.com/zh/learn/ml/mlCrossValidation.

Ch.14

你在 Netflix 上见过「为你推荐」吗？ 协同过滤 会根据与你口味相似的其他用户的高分项来推荐。本章从评分矩阵、相似度、近邻预测的概念到公式，再到实际应用，循序渐进地讲解。

选择章节后，下方图示会切换为该章节内容。可一览机器学习脉络。

由用户×物品评分矩阵找出相似用户（近邻），用其评分预测空白格。

\hat{r}_{u,i}=\frac{5+4}{2}=4.5\approx4

\hat{r}_{u,i}

u

推荐是业务与体验的核心 — 好的推荐能提高转化与留存。协同过滤仅靠行为数据即可做 个性化 ，无需丰富元数据。 机器学习的重要应用 — 推荐不同于分类/回归，是「填矩阵空位」的问题。理解协同过滤是后续矩阵分解、深度学习推荐的基础。

s_{u,v}

推荐基础：协同过滤

什么是协同过滤？ — 利用其他用户的行为（评分、点击、购买）来为你推荐。直觉是「口味相似的人喜欢的东西也相似」。广泛应用于流媒体、电商、音乐等。

直觉：借用近邻的选择 — 例如电影推荐：若与你在 A、B 上打分相近的人也给 C 打了高分，你可能也会喜欢 C。这些「相似的人」就是近邻，用近邻的评分做预测是协同过滤的核心。

数学表示：评分矩阵与预测 — 用户

u

对物品

i

的评分记为

r_{u,i}

，评分矩阵大小为（用户×物品），很多格是空的（稀疏）。基于用户的协同过滤先找用户

u

的相似近邻

N_u

，再对未评分物品

i

用近邻评分的加权平均得到预测

\hat{r}_{u,i}

。相似度常用余弦相似度或皮尔逊相关。

实际与局限 — 冷启动（新用户/新物品没有近邻）、稀疏性使纯协同过滤受限，常与基于内容或矩阵分解结合。