大家的AI
机器学习Playground 试玩

游乐场

动手实验的 AI 实验室

深度学习

  • 神经网络分类器
  • 损失地形实验室

机器学习

  • KNN 近邻分类器

强化学习

  • 强化学习智能体

计算机视觉

  • 卷积视觉

Transformer

  • 注意力 Playground

LLM 智能体

  • Claude 智能体
神经网络分类器损失地形实验室KNN 近邻分类器强化学习智能体卷积视觉注意力 PlaygroundClaude 智能体
加载中…

游乐场

Claude Code 多智能体

跟随 Claude Code 接收用户提示、spawn 子智能体,并用 Read·Write·Bash·Glob 工具逐步完成 ML 任务!

回合0/8
设置说明

在子智能体名册中开关专家角色。▶ 播放后 Claude Code 通过 Task() 委派,关闭的角色会使会话中断。

用户提示

要让 Claude Code 处理哪种 ML 任务?

每个场景都是真实 repo 中 Claude Code 会处理的 ML 任务。orchestrator 通过 Task(subagent=...) 委派,各智能体调用工具。

提示

客户流失预测

“请使用 telco_churn.csv 电信客户数据构建 XGBoost 分类器,并在验证集上达到 AUC 0.80 以上。”

🎯 交付验证 AUC ≥ 0.80 的流失预测模型

✦所有子智能体均假设在 Claude Code 会话中运行。

💡 关闭 Code 子智能体后 ▶ 播放 — 会话会在 Write train_*.py 步骤停止。

任务分解工作簿

8 步 · 各智能体子任务

orchestrator 将用户提示拆成 8 个子任务并通过 Task() 委派的路线图。▶ 播放时高亮当前回合。

待解问题

客户流失预测

交付验证 AUC ≥ 0.80 的流失预测模型

  1. 1🧭
    Orchestratororchestrator·会话规划

    将大问题拆分为 8 个子任务

  2. 2📊
    Datadata-agent·数据检索

    查找符合请求的 CSV 数据集

  3. 3📊
    Datadata-agent·预处理

    构建可训练的特征矩阵

  4. 4🧠
    Modelmodel-agent·模型设计

    设计适合表格数据的分类器

  5. 5🧠
    Modelmodel-agent·HPO

    寻找最大化验证 AUC 的超参数

  6. 6💻
    Codecode-agent·代码生成

    编写可复现的训练脚本

  7. 7✅
    Verifyverify-agent·验证

    检查 AUC 目标与数据泄漏

  8. 8🚀
    Deploydeploy-agent·部署

    保存模型制品(部署可选)

子智能体名册

可 spawn 的专家 ON/OFF

✦Claude CodeClaude Code 会话

orchestrator 编写 plan 并通过 Task(subagent=...) 委派 · 各智能体使用 Read/Write/Bash/Glob 工具

已启用子智能体 5/6

Claude Code orchestrator 通过 Task() 调用的子智能体。orchestrator 始终启用,其余可切换。

  • 🧭
    Orchestratororchestrator✦Claude必选

    Task() spawn 子智能体 · 编写 .cursor/plan.md

    orchestrator · Task() spawn · .cursor/plan.md

    始终开启已开启
  • 📊
    Datadata-agent✦Claude必选

    Glob/Read/Grep · Write/Bash 预处理

    Glob/Read/Grep 探索 · Write/Bash 预处理

    已开启
  • 🧠
    Modelmodel-agent✦Claude必选

    Write/Edit configs · Bash HPO

    Write configs/*.yaml · Bash HPO/调参

    已开启
  • 💻
    Codecode-agent✦Claude必选

    Write/Edit train/serve 脚本

    Write/Edit train_*.py · serve_*.py

    已开启
  • ✅
    Verifyverify-agent✦Claude必选

    Bash 评估与审计 · Read metrics

    Bash pytest/bench · Read metrics.json

    已开启
  • 🚀
    Deploydeploy-agent✦Claude可选

    Write manifest · kubectl/curl Bash

    Write deploy/*.yaml · kubectl/curl Bash

    已关闭

本场景必选角色

  • 📊 Data ✓
  • 🧠 Model ✓
  • 💻 Code ✓
  • ✅ Verify ✓
  • 🚀 Deploy (可选)

会话看板

点击切换 · 回合进度

横向轨道是 Claude Code 会话中的子智能体委派顺序。点击角色切换 spawn 对象会重置会话。

Claude Code 会话

·✦Claude Code

名册与会话看板均可同样方式选择子智能体。

Claude Code 会话日志

Task 委派 · tool use · 上下文传递

每个回合对应子智能体的 tool use。查看 Glob/Read/Write/Bash 调用与 workspace 上下文传递。

▸Claude Code~/modudl-ml · Claude Codeorchestrator 编写 plan 并通过 Task(subagent=...) 委派 · 各智能体使用 Read/Write/Bash/Glob 工具
👤

客户流失预测

请使用 telco_churn.csv 电信客户数据构建 XGBoost 分类器,并在验证集上达到 AUC 0.80 以上。

🎯 交付验证 AUC ≥ 0.80 的流失预测模型

会话进度0%

按 ▶ 播放开始 Claude Code 会话。

会话结果

所有必选回合是否通过

已启用子智能体

4

总回合

8

已完成回合

0

必选角色

4

按 ▶ 播放或单步运行 Claude Code 会话。

相关章节

  • RAG:用检索减轻幻觉
  • LLM 智能体:会使用工具的模型
  • 进阶深度学习:大模型与生成式AI范式