Jerry Ji's picture

5 1

Jerry Ji

jerryji

·

AI & ML interests

None yet

Organizations

None yet

upvoted 3 papers 8 months ago

RWKV-7 "Goose" with Expressive Dynamic State Evolution

Paper • 2503.14456 • Published Mar 18 • 153

Implicit Reasoning in Transformers is Reasoning through Shortcuts

Paper • 2503.07604 • Published Mar 10 • 23

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published Feb 20 • 104

upvoted 2 papers 9 months ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published Feb 16 • 165

LIMO: Less is More for Reasoning

Paper • 2502.03387 • Published Feb 5 • 62