Model Optimization & Efficient AI (모델 최적화 및 경량화)
분류 대상
연산 효율성을 극대화하기 위한 Low-Rank Approximation, LoRA, 양자화(Quantization), 가지치기(Pruning) 등 모델 압축 및 가속화 관련 논문.
키워드
경량화, 파라미터 효율성, 추론 속도 개선, 메모리 최적화
연산 효율성을 극대화하기 위한 Low-Rank Approximation, LoRA, 양자화(Quantization), 가지치기(Pruning) 등 모델 압축 및 가속화 관련 논문.
경량화, 파라미터 효율성, 추론 속도 개선, 메모리 최적화