[要約と導入] 3 行サマリー + 問題提起
3 行サマリー
- ① 従来の致命的な非効率: GP や RL ベースの記号回帰は データセットが変わるたびに探索をゼロから やり直し、学んだ「式の文法」を再利用しにくい。毎朝レシピを一から発明するようなもの。
- ② 古典的手法の限界: LightGBM や LSTM は予測は強いが ブラックボックス。人手設計は探索空間が広すぎてスケールしない。
- ③ 論文の核: 多様な 合成株価で Transformer を事前学習し、実データ だけで RPN 形式のアルファ式を即生成——多くの「偽の厨房」で練習したシェフが、本番の材料で皿を出すイメージ。
比喩: レシピを毎回ランダム試行するロボ vs 文法を体に染み込ませたシェフ
従来探索は 厨房(市場)が変わるたびに調味料比率をやり直すロボです。AlphaFormer は 合成データの厨房で文法を学び、実戦の材料 を見て その場で式(アルファ因子)を完成させます。ブラックボックスに頼らず探索コストを下げる方向です。