Model Optimization & Efficient AI
Scope
Model compression and acceleration: low-rank approximation, LoRA, quantization, pruning, and related methods.
Keywords
Compression, parameter efficiency, inference speed, memory optimization
이 카테고리의 세부 논문 리뷰
1개현재 공개된 세부 논문을 바로 확인할 수 있습니다.