Files · cc978444ec9e536f67f4db6f753df2287479d01c · academic / LLM / Awesome LLM Inference

An error occurred while fetching folder content.

DefTruth authored 1 month ago

🔥[MHA2MLA] Towards Economical Inference: Enabling DeepSeek’s Multi-Head Latent Attention in Any Transformer-based LLMs (#122)

cc978444