Jinqi Xiao's picture

1

Jinqi Xiao

jinqixiao

jinqixiao

AI & ML interests

None yet

Organizations

None yet

authored a paper 12 months ago

HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading

Paper • 2502.12574 • Published Feb 18, 2025 • 13

authored a paper over 2 years ago

COMCAT: Towards Efficient Compression and Customization of Attention-Based Vision Models

Paper • 2305.17235 • Published May 26, 2023 • 2