Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

33

Full-text search

Active filters: Int8

QuantTrio/Qwen3-30B-A3B-Instruct-2507-GPTQ-Int8

Text Generation • 8B • Updated Sep 5 • 188k • 9

QuantTrio/Kimi-Dev-72B-GPTQ-Int8

Text Generation • 73B • Updated 14 days ago • 15 • 1

AXERA-TECH/InternVL2_5-1B

Image-Text-to-Text • Updated Sep 22 • 6 • 1

AXERA-TECH/SmolLM2-360M-Instruct

Updated 7 days ago • 50

AXERA-TECH/SmolVLM-256M-Instruct

Updated Apr 4 • 8 • 2

AXERA-TECH/Qwen2.5-VL-3B-Instruct

Image-Text-to-Text • Updated 10 days ago • 45

JunHowie/Qwen3-0.6B-GPTQ-Int8

Text Generation • 0.3B • Updated Sep 3 • 14

JunHowie/Qwen3-1.7B-GPTQ-Int8

Text Generation • 0.7B • Updated Sep 3 • 19

JunHowie/Qwen3-32B-GPTQ-Int8

Text Generation • 10B • Updated Sep 5 • 237 • 3

AXERA-TECH/Qwen3-0.6B

Text Generation • Updated Sep 18 • 9

JunHowie/Qwen3-14B-GPTQ-Int8

Text Generation • 5B • Updated Sep 5 • 128

JunHowie/Qwen3-8B-GPTQ-Int8

Text Generation • 3B • Updated Sep 4 • 101

AXERA-TECH/Qwen3-1.7B

Text Generation • Updated Sep 25 • 28

AXERA-TECH/Qwen3-4B

Text Generation • Updated 18 days ago • 23

JunHowie/Qwen3-4B-GPTQ-Int8

Text Generation • 1B • Updated Sep 4 • 22

AXERA-TECH/Real-ESRGAN

Image-to-Image • Updated May 4 • 13

AXERA-TECH/siglip-so400m-patch14-384

Zero-Shot Image Classification • Updated May 7

JunHowie/Qwen3-30B-A3B-GPTQ-Int8

Text Generation • 8B • Updated Sep 6 • 26

AXERA-TECH/InternVL2_5-1B-MPO

Image-Text-to-Text • Updated Aug 8 • 6

AXERA-TECH/InternVL3-1B

Image-Text-to-Text • Updated Aug 27 • 1

QuantTrio/Qwen3-30B-A3B-Thinking-2507-GPTQ-Int8

Text Generation • 8B • Updated Sep 5 • 968 • 2

AXERA-TECH/Qwen2.5-VL-7B-Instruct

Image-Text-to-Text • Updated Aug 23 • 9

QuantTrio/Qwen3-Coder-30B-A3B-Instruct-GPTQ-Int8

Text Generation • 8B • Updated Sep 5 • 1.16k • 4

AXERA-TECH/Qwen2.5-Omni-3B

Image-Text-to-Text • Updated Aug 5

JunHowie/Qwen3-4B-Instruct-2507-GPTQ-Int8

Text Generation • 1B • Updated Sep 4 • 75

JunHowie/Qwen3-4B-Thinking-2507-GPTQ-Int8

Text Generation • 1B • Updated Sep 4 • 115 • 2

JunHowie/Qwen3-30B-A3B-Instruct-2507-GPTQ-Int8

Text Generation • 8B • Updated Sep 8 • 53

JunHowie/Qwen2-7B-Instruct-GPTQ-Int8

Text Generation • 3B • Updated Sep 3 • 11

JunHowie/Qwen3-30B-A3B-Thinking-2507-GPTQ-Int8

Text Generation • 8B • Updated Sep 8 • 12

JunHowie/Seed-OSS-36B-Instruct-GPTQ-Int8

Text Generation • 11B • Updated Sep 15 • 2