Files · d7dac51f74c1f1e4aec0a4a96c19e866b13c50c0 · academic / awesome / Awesome LLM System Papers

An error occurred while fetching folder content.

JYYHH authored 7 months ago

Add paper: DeFT: Flash Tree-attention with IO-Awareness for Efficient Tree-search-based LLM Inference

d7dac51f