Search Test Information Space

Found 1 bookmarks

Custom sorting

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

#Apple #Edge Computing #Large Language Models #Paper #PDF

·arxiv.org·Dec 22, 2023

LLM in a flash: Efficient Large Language Model Inference with Limited Memory