Andrew Zhao's picture

Andrew Zhao

andrewzh

·

https://andrewzh112.github.io/

AI & ML interests

Reinforcement Learning, Agents

Recent Activity

upvoted a paper 15 days ago

HopChain: Multi-Hop Data Synthesis for Generalizable Vision-Language Reasoning

upvoted a paper 21 days ago

Are My Optimized Prompts Compromised? Exploring Vulnerabilities of LLM-based Optimizers

upvoted a paper 2 months ago

Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning

View all activity

Organizations

Collections 1

Papers 14

arxiv:2510.14381

arxiv:2507.14201

arxiv:2506.01939

arxiv:2505.03335

models 3

andrewzh/Absolute_Zero_Reasoner-Coder-14b

15B • Updated May 6, 2025 • 48 • 29

andrewzh/Absolute_Zero_Reasoner-Coder-3b

3B • Updated May 6, 2025 • 9 • 14

andrewzh/Absolute_Zero_Reasoner-Coder-7b

8B • Updated May 5, 2025 • 197 • 20

datasets 0

None public yet