Zhiheng Xi's picture

3 8

Zhiheng Xi

WooooDyy

·

AI & ML interests

None yet

Recent Activity

commented on a paper about 23 hours ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

upvoted a paper 1 day ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

commented on a paper 1 day ago

Critique-RL: Training Language Models for Critiquing through Two-Stage Reinforcement Learning

View all activity

Organizations

Papers 18

arxiv:2501.11425

arxiv:2501.02506

arxiv:2410.18798

arxiv:2408.14874

models 0

None public yet

datasets 0

None public yet