3 5 3

Jiahao Xu

Jiahao004

Jiahao004

AI & ML interests

Sentence Emebddings; Neural Machine Translation

Organizations

Collections 1

Papers 3

arxiv:2501.18585

arxiv:2411.19943

arxiv:2411.18462

models 13

Jiahao004/agentllm_SFT-template-3_1_qwen-train-Qwen3-8B-1e-5LR_best

Text Generation • 308k • Updated Jul 10 • 14

Jiahao004/SFT-agentllm-template2-train4-Qwen3-0.6B-1e-6LR-3Epochs-32768Tokens-1BS-think-step-by-step

0.6B • Updated Jun 27

Jiahao004/SFT-agentllm-template2-train3-1example-Qwen3-0.6B-1e-5LR-50Epochs-checkpoint-50

0.6B • Updated Jun 27

Jiahao004/SFT-agentllm-template1-train2-Qwen3-0.6B-1e-5LR-50Epochs-32768Tokens-1BS-think-step-by-step

Text Generation • 0.6B • Updated Jun 25

Jiahao004/SFT-agentllm-template1-Qwen3-0.6B-5e-5LR-3Epochs-32768Tokens-1BS-think-step-by-step

0.6B • Updated Jun 25 • 4

Jiahao004/agentllm-SFT-baseline-Qwen3-8B-5e-5LR-3Epochs

308k • Updated Jun 25

Jiahao004/SFT-agentllm-template1-Qwen3-8B-5e-5LR-3Epochs-32768Tokens-1BS-think-step-by-step

8B • Updated Jun 25

Jiahao004/SFT-agentllm-template1-Qwen3-8B-5e-5LR-3Epochs-32768Tokens

8B • Updated Jun 24 • 1

Jiahao004/test

Updated Jun 24

Jiahao004/SFT-agentllm-template1-Qwen3-0.6B-5e-5LR-3Epochs-32768Tokens-1BS-1GA-flash-attn2-8GPUs-1Nodes

0.6B • Updated Jun 23

View 13 models

datasets 5

Jiahao Xu

AI & ML interests

Organizations

Collections 1

Jiahao004/DeepTheorem

Jiahao004/DeepTheorem-qwen-1.5b-rl

Jiahao004/DeepTheorem-qwen-3b-rl

Jiahao004/DeepTheorem-qwen-7b-rl

Jiahao004/DeepTheorem

Jiahao004/DeepTheorem-qwen-1.5b-rl

Jiahao004/DeepTheorem-qwen-3b-rl

Jiahao004/DeepTheorem-qwen-7b-rl

Papers 3

models 13

Jiahao004/agentllm_SFT-template-3_1_qwen-train-Qwen3-8B-1e-5LR_best

Jiahao004/SFT-agentllm-template2-train4-Qwen3-0.6B-1e-6LR-3Epochs-32768Tokens-1BS-think-step-by-step

Jiahao004/SFT-agentllm-template2-train3-1example-Qwen3-0.6B-1e-5LR-50Epochs-checkpoint-50

Jiahao004/SFT-agentllm-template1-train2-Qwen3-0.6B-1e-5LR-50Epochs-32768Tokens-1BS-think-step-by-step

Jiahao004/SFT-agentllm-template1-Qwen3-0.6B-5e-5LR-3Epochs-32768Tokens-1BS-think-step-by-step

Jiahao004/agentllm-SFT-baseline-Qwen3-8B-5e-5LR-3Epochs

Jiahao004/SFT-agentllm-template1-Qwen3-8B-5e-5LR-3Epochs-32768Tokens-1BS-think-step-by-step

Jiahao004/SFT-agentllm-template1-Qwen3-8B-5e-5LR-3Epochs-32768Tokens

Jiahao004/test

Jiahao004/SFT-agentllm-template1-Qwen3-0.6B-5e-5LR-3Epochs-32768Tokens-1BS-1GA-flash-attn2-8GPUs-1Nodes

datasets 5

Jiahao004/agentllm_trainingset

Jiahao004/agentllm

Jiahao004/agentll_trainingset

Jiahao004/DeepTheorem

Jiahao004/HMMT_FIMO_Putnam

Jiahao Xu

AI & ML interests

Organizations

Collections 1

Papers 3

models 13 Sort: Recently updated

datasets 5 Sort: Recently updated

models 13

datasets 5