README.md · main · academic / awesome / Awesome Efficient LLM

Dec 09, 2024

[ADD] SKIM: Any-bit Quantization Pushing The Limits of Post-Training... · 589c1433

horseee authored Dec 09, 2024

[ADD] SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization & CPTQuant -- A Novel Mixed Precision Post-Training Quantization Techniques for Large Language Models & Efficient LLM Inference using Dynamic Input Pruning and Cache-Aware Masking

589c1433

[ADD] SKIM: Any-bit Quantization Pushing The Limits of Post-Training...

horseee authored Dec 09, 2024

[ADD] SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization & CPTQuant -- A Novel Mixed Precision Post-Training Quantization Techniques for Large Language Models & Efficient LLM Inference using Dynamic Input Pruning and Cache-Aware Masking