tencent
/

Hunyuan-7B-Instruct-FP8

Text Generation

hunyuan_v1_dense

compressed-tensors

Model card Files Files and versions

Hunyuan-7B-Instruct-FP8 / hf_quant_config.json

manaestras's picture

Upload hf_quant_config.json with huggingface_hub

0b9bc85 verified 3 months ago

history blame contribute delete

192 Bytes

	{
	"quantization": {
	"exclude_modules": [
	"lm_head",
	"model.embed_tokens"
	],
	"kv_cache_quant_algo": null,
	"quant_algo": "FP8"
	}
	}