21 29 31

Rui Yang

Ray2333

https://yangrui2015.github.io

YangRui2015

AI & ML interests

Deep Reinforcement Learning

Recent Activity

authored a paper 16 days ago

ERA: Transforming VLMs into Embodied Agents via Embodied Prior Learning and Online Reinforcement Learning

upvoted a paper 16 days ago

GAR: Generative Adversarial Reinforcement Learning for Formal Theorem Proving

upvoted a paper 16 days ago

ERA: Transforming VLMs into Embodied Agents via Embodied Prior Learning and Online Reinforcement Learning

View all activity

Organizations

Collections 1

Papers 6

models 15

datasets 1

Ray2333/RiC_harmless_helpful

Viewer • Updated Jul 12, 2024 • 291k • 111

Rui Yang

AI & ML interests

Recent Activity

Organizations

Collections 1

Ray2333/GRM-llama3-8B-sftreg

Ray2333/GRM-llama3-8B-distill

Ray2333/GRM-Gemma-2B-sftreg

Regularizing Hidden States Enables Learning Generalizable Reward Model for LLMs

Ray2333/GRM-llama3-8B-sftreg

Ray2333/GRM-llama3-8B-distill

Ray2333/GRM-Gemma-2B-sftreg

Regularizing Hidden States Enables Learning Generalizable Reward Model for LLMs

Papers 6

models 15

Ray2333/GRM-Llama3.2-3B-rewardmodel-ft

Ray2333/Gemma-2B-rewardmodel-baseline

Ray2333/GRM-llama3-8B-distill

Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback

Ray2333/GRM-Gemma-2B-rewardmodel-ft

Ray2333/Gemma-2B-rewardmodel-ft

Ray2333/GRM-llama3.2-3B-sftreg

Ray2333/GRM-Gemma-2B-sftreg

Ray2333/GRM-llama3-8B-sftreg

Ray2333/GRM-Gemma2-2B-sftreg

datasets 1

Ray2333/RiC_harmless_helpful

Rui Yang

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 6

models 15 Sort: Recently updated

datasets 1

models 15