6 169 192

Inui

Norm

https://normxu.github.io/

AI & ML interests

Video Diffusion; Large Language Model; Object Detection; OCR

Recent Activity

upvoted a paper 19 days ago

Less is More: Recursive Reasoning with Tiny Networks

liked a model about 1 month ago

rednote-hilab/dots.ocr

liked a model 2 months ago

meituan-longcat/LongCat-Flash-Chat

View all activity

Organizations

Collections 9

View 9 collections

Papers 1

arxiv:2504.07491

models 2

Norm/nougat-latex-base

Image-to-Text • 0.3B • Updated Feb 26, 2024 • 3.06k • 81

Norm/ERNIE-Layout-Pytorch

Updated Nov 14, 2023 • 801 • 16

datasets 0

None public yet

Inui

AI & ML interests

Recent Activity

Organizations

Collections 9

WF-VAE: Enhancing Video VAE by Wavelet-Driven Energy Flow for Latent Video Diffusion Model

MAGVIT: Masked Generative Video Transformer

Language Model Beats Diffusion -- Tokenizer is Key to Visual Generation

Finite Scalar Quantization: VQ-VAE Made Simple

Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations

WF-VAE: Enhancing Video VAE by Wavelet-Driven Energy Flow for Latent Video Diffusion Model

MAGVIT: Masked Generative Video Transformer

Language Model Beats Diffusion -- Tokenizer is Key to Visual Generation

Finite Scalar Quantization: VQ-VAE Made Simple

Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations

Papers 1

models 2

Norm/nougat-latex-base

Norm/ERNIE-Layout-Pytorch

datasets 0

Inui

AI & ML interests

Recent Activity

Organizations

Collections 9

Papers 1

models 2 Sort: Recently updated

datasets 0

models 2