VLM/Robotics - a kurogane Collection

kurogane 's Collections

VLM/Robotics

updated May 28, 2025

Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding

Paper • 2311.08046 • Published Nov 14, 2023 • 2
nvidia/GR00T-N1-2B

Robotics • 2B • Updated Sep 2, 2025 • 131 • 341
nvidia/Eagle2-1B

Image-Text-to-Text • 1B • Updated Apr 27, 2025 • 159 • 26
nvidia/PhysicalAI-Robotics-GR00T-X-Embodiment-Sim

Updated 27 days ago • 841k • 180
lerobot/pi0_old

Robotics • 4B • Updated Sep 19, 2025 • 540 • 304
facebook/vc1-base

Robotics • Updated Apr 7, 2023 • 16 • 13
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality

Paper • 2411.15241 • Published Nov 22, 2024 • 7
MobileMamba: Lightweight Multi-Receptive Visual Mamba Network

Paper • 2411.15941 • Published Nov 24, 2024 • 2
timm/shvit_s4.in1k

Image Classification • Updated May 26, 2025 • 48
Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model

Paper • 2401.09417 • Published Jan 17, 2024 • 62
Theia: Distilling Diverse Vision Foundation Models for Robot Learning

Paper • 2407.20179 • Published Jul 29, 2024 • 47