机器学习 AI论文

搜索全部章节…

学习

搜索全部章节…

AI论文
理论·数学基础
- 2026
  - CPAL
    - Kernel von Mises 影响函数公式
模型优化·轻量化
- PolarQuant：基于极坐标变换的 KV 缓存量化
核心架构·算法
- 2026
  - CPAL
    - AlphaFormer：使用 Transformer 的端到端阿尔法因子符号回归
预测·表格数据
AutoML·ML 流水线
- 2025
  - ICML
    - AutoML-Agent：面向全流程 AutoML 的多智能体 LLM 框架
  - ICLR
    - SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning
视觉·多模态
NLP·大模型
- 2026
  - CPAL
    - 大语言模型中的深度诅咒
可信·可解释
数据为中心·特征
边缘·网页·服务
领域应用

🏅我的成就

学习/AI论文/核心架构·算法/CPAL2026/AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers

AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers

在量化实务中，阿尔法因子仍常在 手工公式 与 黑盒模型 之间摇摆。AlphaFormer 用 合成时序预训练 Transformer，对新市场数据 端到端生成可解释的符号公式。本文逐行拆解线性因子池、IC 指标与类 PPO 的稳定化损失。

PDF打开原文 PDF↗

X_t

t

z_t = g(X_t) = \sum_{k=1}^{m} w_k\, f_k(X_t)

t

[实验与结果] - 搜索效率： 相比强基线 生成更少候选因子 仍可在 CSI300/CSI500 上取得 一流 IC/Rank IC ——不是把针眼扩大，而是 手更稳 。 - 推理效率： 叙述上强调推理阶段 无需大规模在线重拟合参数 。 - 泛化： 多架构生成器集成 合成数据时 IC 更高； 在中国预训练、美国 S&P500 零样本 仍有竞争力，暗示学到部分 时序/算子语法 而非单市场噪声。 实务解读： 若要在 GPU 小时受限 下拿到 可解释因子 ，“合成预训练 + 有界 RL 微调”在 MLOps 上是务实折中。

[结论与局限] 实务启示（不超过 3 条） 1. 白盒信号： RPN/运算树可把 公式原文 交给风控。 2. 降低搜索税： 语法预压缩减少 每次换市场的冷启动 。 3. 端到端管线： 生成\to池化\toIC\to(可选)PPO，流程短、易复现部署。 局限 - 硬件： GPU 训练/推理前提可能 不适配纯 CPU 遗留环境 。 - 体制： 零样本再强，结构突变后仍可能要 再训练或域适应 。 - 标签： IC 严重依赖 未来收益定义与泄露控制 。

可视化策划：失控探索 vs 可控生成

左： 探索空间 上密集散点与 难以触及 IC 目标的曲折路径 ，表现冷启动符号搜索。右： 合成序列\to预训练\to令牌化公式\toIC/池 的 单线流水线 ，对应 AlphaFormer 端到端流程。

传统：GP / RL 符号搜索

换数据集就从头广撒网；候选再多 IC 仍可能乱跳。

提案：AlphaFormer

合成学语法；更少生成就可稳步抬高 IC，并具备零样本迁移潜力。

AlphaFormer 把“每个市场从零符号搜索”换成 语法预训练 + 带裁剪的 RL 微调 。池、L1、IC、PPO 像 搅拌器、剪刀、评委、安全带 分工。注意 GPU 依赖 与 标签质量 ，从 PoC 渐进落地更稳妥。

관련 AI논문

- AutoML-Agent：面向全流程 AutoML 的多智能体 LLM 框架
- 大语言模型中的深度诅咒
- Kernel von Mises 影响函数公式