Model Optimization & Efficient AI (모델 최적화 및 경량화)

분류 대상

연산 효율성을 극대화하기 위한 Low-Rank Approximation, LoRA, 양자화(Quantization), 가지치기(Pruning) 등 모델 압축 및 가속화 관련 논문.

키워드

경량화, 파라미터 효율성, 추론 속도 개선, 메모리 최적화