[摘要与引言] 三行总结 + 问题提出
三行总结
- ① 旧方法的致命低效: 基于 GP 或 RL 的符号回归在 每个新数据集上几乎从零搜索,难以复用已学到的“公式语法”。像每天早上重新发明菜谱。
- ② 经典路线的短板: LightGBM、LSTM 等预测强但 不可解释;纯人工写因子又无法覆盖巨大搜索空间。
- ③ 论文核心: 用多样 合成股价路径预训练 Transformer,给定真实 即可 即时生成 RPN 形式的阿尔法公式——像在无数假厨房练过的大厨,换厨房仍能出菜。
比喻:随机试配方的机器人 vs. 语法刻进肌肉记忆的大厨
传统符号搜索像 厨房(市场)一变就重新调盐糖比例 的机器人。AlphaFormer 在 合成厨房 里学会组合法则,看到实战食材 就能 当场拼出公式(阿尔法因子)——更少依赖黑盒,也降低反复盲搜的成本。