Shang-Wen Daniel Li's picture

13 18

Shang-Wen Daniel Li

swdanielli

·

https://swdanielli.github.io

AI & ML interests

Large foundation models, vision and language multimodal, and pretraining and self-supervised training

Recent Activity

liked a model 28 days ago

facebook/DepthLM

upvoted a paper 28 days ago

DepthLM: Metric Depth From Vision Language Models

upvoted a collection about 2 months ago

View all activity

Organizations

Papers 19

arxiv:2507.22062

arxiv:2502.09604

arxiv:2410.17251

arxiv:2405.01582

models 1

swdanielli/Qwen2-VL-2B-Instruct-SFT

datasets 0

None public yet