Zhongpai Gao's picture

204 14

Zhongpai Gao

gaozhongpai

·

Gaozhongpai

AI & ML interests

3D computer vision

Recent Activity

upvoted a paper 11 days ago

Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length

upvoted a paper 13 days ago

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

upvoted a paper 17 days ago

DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation

View all activity

Organizations

upvoted a paper 11 days ago

Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length

Paper • 2512.04677 • Published 12 days ago • 166

upvoted a paper 13 days ago

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

Paper • 2512.02556 • Published 14 days ago • 212

upvoted 3 papers 17 days ago

DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation

Paper • 2511.19365 • Published 22 days ago • 63

SAM 3: Segment Anything with Concepts

Paper • 2511.16719 • Published 25 days ago • 114

ROOT: Robust Orthogonalized Optimizer for Neural Network Training

Paper • 2511.20626 • Published 21 days ago • 42

upvoted a paper 24 days ago

MHR: Momentum Human Rig

Paper • 2511.15586 • Published 27 days ago • 13

upvoted a paper 25 days ago

SAM2S: Segment Anything in Surgical Videos via Semantic Long-term Tracking

Paper • 2511.16618 • Published 26 days ago • 7

upvoted a paper 29 days ago

Depth Anything 3: Recovering the Visual Space from Any Views

Paper • 2511.10647 • Published Nov 13 • 94

upvoted 2 papers about 2 months ago

Video-Thinker: Sparking "Thinking with Videos" via Reinforcement Learning

Paper • 2510.23473 • Published Oct 27 • 84

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

Paper • 2510.18927 • Published Oct 21 • 83

upvoted 2 papers 3 months ago

Durian: Dual Reference-guided Portrait Animation with Attribute Transfer

Paper • 2509.04434 • Published Sep 4 • 10

FLOAT: Generative Motion Latent Flow Matching for Audio-driven Talking Portrait

Paper • 2412.01064 • Published Dec 2, 2024 • 47

upvoted 8 papers 4 months ago

TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis

Paper • 2508.13618 • Published Aug 19 • 18

Multi-View 3D Point Tracking

Paper • 2508.21060 • Published Aug 28 • 23

Gaze into the Heart: A Multi-View Video Dataset for rPPG and Health Biomarkers Estimation

Paper • 2508.17924 • Published Aug 25 • 14

MIDAS: Multimodal Interactive Digital-human Synthesis via Real-time Autoregressive Video Generation

Paper • 2508.19320 • Published Aug 26 • 29

4DNeX: Feed-Forward 4D Generative Modeling Made Easy

Paper • 2508.13154 • Published Aug 18 • 62

FantasyTalking2: Timestep-Layer Adaptive Preference Optimization for Audio-Driven Portrait Animation

Paper • 2508.11255 • Published Aug 15 • 11

DisTime: Distribution-based Time Representation for Video Large Language Models

Paper • 2505.24329 • Published May 30 • 1

DeepVideo-R1: Video Reinforcement Fine-Tuning via Difficulty-aware Regressive GRPO

Paper • 2506.07464 • Published Jun 9 • 14