Starstrek's picture

1652 1395

Starstrek

Stars321123

·

Stars321

AI & ML interests

AI

Recent Activity

liked a model about 1 hour ago

unsloth/Qwen3-Coder-Next-FP8-Dynamic

upvoted a paper about 1 hour ago

CodeOCR: On the Effectiveness of Vision Language Models in Code Understanding

liked a model about 1 hour ago

ACE-Step/Ace-Step1.5

View all activity

Organizations

upvoted 2 papers about 1 hour ago

CodeOCR: On the Effectiveness of Vision Language Models in Code Understanding

Paper • 2602.01785 • Published 2 days ago • 50

TTCS: Test-Time Curriculum Synthesis for Self-Evolving

Paper • 2601.22628 • Published 5 days ago • 31

upvoted 2 papers about 11 hours ago

Green-VLA: Staged Vision-Language-Action Model for Generalist Robots

Paper • 2602.00919 • Published 3 days ago • 182

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published 1 day ago • 116

upvoted a collection about 11 hours ago

Agentic Advancement

2 items • Updated about 16 hours ago • 2

upvoted a paper about 11 hours ago

Kimi K2.5: Visual Agentic Intelligence

Paper • 2602.02276 • Published 1 day ago • 168

upvoted 3 papers about 13 hours ago

Advancing Open-source World Models

Paper • 2601.20540 • Published 7 days ago • 110

Closing the Loop: Universal Repository Representation with RPG-Encoder

Paper • 2602.02084 • Published 2 days ago • 78

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published 6 days ago • 137

upvoted a paper 2 days ago

The Script is All You Need: An Agentic Framework for Long-Horizon Dialogue-to-Cinematic Video Generation

Paper • 2601.17737 • Published 10 days ago • 55

upvoted 2 collections 2 days ago

Makeup Transfer

2 items • Updated Feb 26, 2025 • 2

OCR

18 items • Updated 1 day ago • 2

upvoted a paper 2 days ago

DeepSeek-OCR 2: Visual Causal Flow

Paper • 2601.20552 • Published 7 days ago • 50

upvoted 4 collections 2 days ago

audio

114 items • Updated 1 day ago • 8

PII & De-Identification

Models for extracting PII entities and de-identifying clinical text, with support for HIPAA and GDPR compliance. • 33 items • Updated 22 days ago • 29

Medical Datasets

12 items • Updated 28 minutes ago • 4

Step-3.5-Flash

step 3.5 models • 3 items • Updated 2 days ago • 19

upvoted 2 papers 4 days ago

Qwen3-ASR Technical Report

Paper • 2601.21337 • Published 6 days ago • 29

MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods

Paper • 2601.21821 • Published 6 days ago • 55

upvoted a collection 4 days ago

Skywork-Unipic3

Unified Multi-Image Composition with Sequence Modeling • 7 items • Updated about 6 hours ago • 10