SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning

Yizhou Chi, Yizhang Lin, Sirui Hong, Duyi Pan, Yaying Fei, Guanghao Mei, Bangbang Liu, Tianqi Pang, Jacky Kwok, Ceyao Zhang, Bang Liu, Chenglin Wu

ICLR 2025 · arXiv:2410.17238

LLM 智能体常生成多样性不足、难以优化的代码，而传统 AutoML 受固定流水线限制。

MCTS（蒙特卡洛树搜索）把实验/决策展开成树，用模拟 rollout 与验证分数决定下一步尝试哪条分支。UCT-DP则改写用于挑选下一节点的 UCT 分数，使训练等代价大的深层步骤不那么被浅层乱搜挤掉。

SELA 将流水线表示为这样的树，用 MCTS 安排实验顺序，并以 UCT-DP 优先更深的训练阶段。本文从 Insight 到归一化分数逐步拆解公式。

PDF查看 PDF（arXiv）

Chapter 1: SELA 与基于树搜索的 AutoML 与上文一致，用平实语句说明：MCTS 在树上用 rollout 与验证分数决定下一步尝试哪条分支；UCT-DP 则改写挑选下一节点时用的 UCT，使训练等代价大的深层步骤较少被浅层搜索挤掉。

什么是蒙特卡洛树搜索（MCTS）？

简要说明： 把接下来要做的实验画成 树 ，反复走下面四步。 - ① 选（选择）： 用 UCT 等规则决定 下一步去哪个节点 。 - ② 加（扩展）： 给树挂上 还没有的子节点 （新的尝试）。 - ③ 跑（rollout）： 在这条分支上跑代码或仿真，得到 验证分数 。 - ④ 传（回传）： 把分数 往父节点上传 ，更新访问次数与平均分。 SELA 用这 四步 加上验证分数，探索 LLM 提出的流水线分支。 UCT 是什么？ （把 Upper Confidence Bound 用到树上）在 兄弟子节点 里选 下一步走哪条 时用的打分规则。它把 平均回报高的分支 （利用）和 访问还少的分支 （探索）放在 同一个式子 里，用数值比较决定下一个节点。论文里的 UCT-DP 会微调 UCT，使 代价更大的深层训练 不那么被 浅层乱搜 挤掉。

四步（一轮）

① 选② 加③ 跑④ 传

紫色虚线表示本次选中的路径示例；多次重复后各分支会累积分数。

[摘要与引言] 三句摘要 + 问题 三句摘要 - 既有 LLM 智能体： 代码 多样性不足 ，多次尝试也 难以收敛 到好解。 - 传统 AutoML： 接近 固定流水线/搜索模板 （如 Auto-sklearn），数据与任务变化时 难以动态重组 流水线。 - SELA 要点： 用 树 表示流水线，用 MCTS 安排实验顺序，用 验证分数 驱动下一分支。 UCT-DP 修改 UCT，使 更深、训练成本更高 的节点优先于浅层乱搜。 比喻： 赛车里 只按工厂保养手册顺序 操作，接近传统 AutoML； 悬挂、发动机 map、胎压一次全改、只跑一圈 就结束，接近单次 LLM 生成。SELA 则像 看分段圈速与遥测（验证分数），再决定下一步调什么并比较分支 的赛道工程师。

Chapter 2: 背景知识 — 读懂正文所需的五个概念 [背景知识] - AutoML： 减少人工介入，自动完成预处理、模型、超参数等流程；常见模式是 试错\to评估\to迭代 。 - LLM 智能体： 根据自然语言任务描述与数据摘要 生成并运行代码 。在 SELA 中 规划 与 代码/执行 分阶段进行。 - 搜索空间（Search space）： 某一数据集/任务上可尝试的 预处理\times模型\times超参数 组合集合。组合爆炸使得 穷举 几乎不可行。 - MCTS： 在树上结合 rollout 与统计，选择 有潜力的分支 ；核心是 探索 与 利用 的平衡。 - 探索 vs 利用： 在 同一个公式里 同时调节“多访问少有人走的路”与“沿高回报路径加深”。 UCT-DP 额外强调 优先更深的训练阶段 。

p

p

Chapter 5: 实验 [结果] 在 20 个 ML 数据集 （arXiv 摘要）上，SELA 相对各基线报告约 65%-80% 胜率 —— 优势稳定 。 MCTS 优于随机搜索 ； 增加 rollout 通常 提升 分数——便于规划 API/时间预算。

Chapter 6: 结论与图示说明 [结论] 可落地要点（\leq3 条） 1. 无需逐步手选 也能得到较强的 AutoML 基线。 2. 缓存 rollout 降低 API/GPU 成本。 3. 树状日志 便于解释 走了哪条分支 。 局限： 向机器人/软件工程等域推广；更大搜索空间需更高样本效率；更强 可解释性 需配套 UI。 [图示] 摘要 - 传统： 线性/一次性流程—反馈弱时难以达到目标质量。 - SELA： 在树上 MCTS + UCT-DP ，用 验证分数 更新—下方 左右图 仅为对比示意。

对比一览

左： 固定顺序与单次生成，反馈可能偏弱。 右： 用验证分数在树上选分支。下图为 示意 。

传统：固定流水线·单次生成

一次定全局或只按规则执行，反馈弱、难以收敛。

实验难度轴

起点 → 目标质量

散乱尝试

难控制

SELA：树搜索 + UCT-DP

按阶段分支，用验证分数更新平均回报。

Insight 候选 Λ（LLM） · 精细实验 · MCTS rollout 与仿真

树上收敛

接近目标的分数

SELA 用 MCTS 在树上排列 LLM 想法 ， UCT-DP 减少浅层浪费。 NS 公平对比，缓存与日志帮助 成本与可解释性 。

SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning

Yizhou Chi, Yizhang Lin, Sirui Hong, Duyi Pan, Yaying Fei, Guanghao Mei, Bangbang Liu, Tianqi Pang, Jacky Kwok, Ceyao Zhang, Bang Liu, Chenglin Wu

ICLR 2025 · arXiv:2410.17238

LLM 智能体常生成多样性不足、难以优化的代码，而传统 AutoML 受固定流水线限制。

SELA 将流水线表示为这样的树，用 MCTS 安排实验顺序，并以 UCT-DP 优先更深的训练阶段。本文从 Insight 到归一化分数逐步拆解公式。

PDF查看 PDF（arXiv）

Chapter 1: SELA 与基于树搜索的 AutoML 与上文一致，用平实语句说明：MCTS 在树上用 rollout 与验证分数决定下一步尝试哪条分支；UCT-DP 则改写挑选下一节点时用的 UCT，使训练等代价大的深层步骤较少被浅层搜索挤掉。

什么是蒙特卡洛树搜索（MCTS）？

简要说明： 把接下来要做的实验画成 树 ，反复走下面四步。 - ① 选（选择）： 用 UCT 等规则决定 下一步去哪个节点 。 - ② 加（扩展）： 给树挂上 还没有的子节点 （新的尝试）。 - ③ 跑（rollout）： 在这条分支上跑代码或仿真，得到 验证分数 。 - ④ 传（回传）： 把分数 往父节点上传 ，更新访问次数与平均分。 SELA 用这 四步 加上验证分数，探索 LLM 提出的流水线分支。 UCT 是什么？ （把 Upper Confidence Bound 用到树上）在 兄弟子节点 里选 下一步走哪条 时用的打分规则。它把 平均回报高的分支 （利用）和 访问还少的分支 （探索）放在 同一个式子 里，用数值比较决定下一个节点。论文里的 UCT-DP 会微调 UCT，使 代价更大的深层训练 不那么被 浅层乱搜 挤掉。

四步（一轮）

① 选② 加③ 跑④ 传

紫色虚线表示本次选中的路径示例；多次重复后各分支会累积分数。

[摘要与引言] 三句摘要 + 问题 三句摘要 - 既有 LLM 智能体： 代码 多样性不足 ，多次尝试也 难以收敛 到好解。 - 传统 AutoML： 接近 固定流水线/搜索模板 （如 Auto-sklearn），数据与任务变化时 难以动态重组 流水线。 - SELA 要点： 用 树 表示流水线，用 MCTS 安排实验顺序，用 验证分数 驱动下一分支。 UCT-DP 修改 UCT，使 更深、训练成本更高 的节点优先于浅层乱搜。 比喻： 赛车里 只按工厂保养手册顺序 操作，接近传统 AutoML； 悬挂、发动机 map、胎压一次全改、只跑一圈 就结束，接近单次 LLM 生成。SELA 则像 看分段圈速与遥测（验证分数），再决定下一步调什么并比较分支 的赛道工程师。

Chapter 1: SELA 与基于树搜索的 AutoML

什么是蒙特卡洛树搜索（MCTS）？

[摘要与引言] 三句摘要 + 问题

Chapter 2: 背景知识 — 读懂正文所需的五个概念

[背景知识]

Chapter 3: 方法 — 带白话注释的公式

[方法] 五个步骤

(1) Insight Proposer

(2) 计划与代码

(3) UCT-DP

(4) NS

(5) Rescaled NS

Chapter 4: 玩具数据走读

[玩具模拟]

Chapter 5: 实验

[结果]

Chapter 6: 结论与图示说明

[结论]

[图示] 摘要

对比一览

传统：固定流水线·单次生成

SELA：树搜索 + UCT-DP

Chapter 1: SELA 与基于树搜索的 AutoML

什么是蒙特卡洛树搜索（MCTS）？

[摘要与引言] 三句摘要 + 问题

Chapter 2: 背景知识 — 读懂正文所需的五个概念

[背景知识]

Chapter 3: 方法 — 带白话注释的公式

[方法] 五个步骤

(1) Insight Proposer

(2) 计划与代码

(3) UCT-DP

(4) NS

(5) Rescaled NS

Chapter 4: 玩具数据走读

[玩具模拟]

Chapter 5: 实验

[结果]

Chapter 6: 结论与图示说明

[结论]

[图示] 摘要

对比一览

传统：固定流水线·单次生成

SELA：树搜索 + UCT-DP