Model Optimization & Efficient AI(モデル最適化と効率化)

分類対象

低ランク近似、LoRA、量子化、プルーニングなど、モデル圧縮・推論加速に関する論文。

キーワード

軽量化、パラメータ効率、推論速度、メモリ最適化