AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML

Patara Trirat, Wonyong Jeong, Sung Ju Hwang

ICML 2025

AutoML-Agentは「AutoMLを少し手伝う」ではなく、データ探索から前処理、モデル設計、HPO、コード生成、そしてデプロイまでを フルパイプライン で自動化するマルチエージェントLLMフレームワークです。この記事では入力→計画→分解→実行→検証の流れを、数式ベースでやさしく読み解きます。

PDF原文PDFを開く

[要約 & 導入] 3行サマリー + 問題提起 3行要約： - 致命的な問題： AutoMLは強力ですが、ツールが複雑で専門性がないと始めにくい。 - 従来の限界： LLMベースの支援はパイプラインの一部しか扱えない場合があり、計画生成が単発で探索が非効率。 - 解決策： AutoML-Agentは複数の専門エージェント協業、 RAP（検索拡張計画） による候補計画の改善、そして マルチステージ検証 でデプロイ可能なコードに到達します。 たとえ： - 既存AutoMLは「材料はあるけど、調理順と火加減は自分でやる」ミールキット。 - LLM補助は「レシピを読んでくれることもあるが、最後まで料理してサーブはしない」半自動トースター。 - AutoML-Agentは「役割分担された厨房スタッフ」が協働し、メニュー（要求）を渡せば材料調達から提供（デプロイ）まで一気通貫。 ここから数式の手順へ入ります。

[背景知識] 必要な基礎概念 数式の理解に必要な5つです。 - Full-Pipeline AutoML： データ探索/選定、前処理、モデル設計、HPO、コード生成、デプロイまでの一連。 - Multi-Agent System： 1つのLLMに全部押し込まず役割を分ける設計。 - Retrieval-Augmented Planning（RAP）： 外部知識を検索して計画を補強する。 - Plan Decomposition & Parallel： 計画を分解し、依存を最小にして並列実行する。 - Multi-Stage Verification： コードが動くか、性能が良いか、デプロイ可能かを段階的に確認する。 この5つが分かれば、本論文の「数式＝地図」が見え始めます。

I

I

[結論と限界] 最終の意義（\leq3）： 1. フルパイプラインの考え方： AutoMLを一工程ではなく連鎖として定義。 2. RAP＋マルチエージェント： 計画探索を単発生成から、導かれた候補探索へ。 3. 検証ファースト： 典型的なLLM失敗（それっぽいのに壊れる）を減らす。 限界 / Future Work： - テンプレ/骨格依存： 新しいタイプのタスクではベースがさらに必要かもしれない。 - バックボーンLLM依存： 強いLLMほど良い計画と実装を出しやすい。 - 指標の設計に敏感： SR/NPSや検証基準の定義次第で評価が変わる。 最後に、全体のオーケストレーションを一枚の図にまとめます。

[図解] フルパイプラインのオーケストレーションボード

I

精密制御

フルパイプライン制御

AutoML-Agent：RAP + マルチエージェント + マルチステージ検証

R

データセットと評価設定

実験は画像・テキスト・表形式・時系列・グラフのベンチマークで行い、成功率と正規化性能を併せて評価します。

AutoML-Agentは「自動化」を部品ではなく 全パイプライン として定義します。RAPが計画探索を加速し、分解されたマルチエージェントが並列で動き、マルチステージ検証が信頼性をロックします。数式が長くても、結局は 1 本の流れとして覚えられます：入力標準化 \to 候補計画 \to 並列実行 \to デプロイ可能な最終コード。

モダリティ	タスク	例
Image	分類	Butterfly Image, Shopee-IET
Text	分類	Ecommerce Text, Textual Entailment
Tabular	分類	Banana Quality, Software Defects
Tabular	回帰	Crab Age, Crop Price
Tabular	クラスタリング	Smoker Status, Higher Education Students Performance
Time Series	予測	Weather, Electricity
Graph	ノード分類	Cora, Citeseer

モダリティ	タスク	例
Image	分類	Butterfly Image, Shopee-IET
Text	分類	Ecommerce Text, Textual Entailment
Tabular	分類	Banana Quality, Software Defects
Tabular	回帰	Crab Age, Crop Price
Tabular	クラスタリング	Smoker Status, Higher Education Students Performance
Time Series	予測	Weather, Electricity
Graph	ノード分類	Cora, Citeseer

AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML

[図解] フルパイプラインのオーケストレーションボード

データセットと評価設定

관련 AI논문

AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML

[図解] フルパイプラインのオーケストレーションボード

データセットと評価設定

관련 AI논문