Kaiyan Zhang's picture

Kaiyan Zhang

iseesaw

·

https://iseesaw.github.io/

AI & ML interests

Large Reasoning Models, Reinforcement Learning, Agent

Recent Activity

authored a paper 30 days ago

FlowRL: Matching Reward Distributions for LLM Reasoning

upvoted a paper 30 days ago

FlowRL: Matching Reward Distributions for LLM Reasoning

upvoted a collection 30 days ago

View all activity

Organizations

Papers 27

arxiv:2509.15207

arxiv:2509.09674

arxiv:2509.08827

arxiv:2509.04419

models 0

None public yet

datasets 0

None public yet