codefuse-ai
/

CodeFuse-DeepSeek-33B-4bits

Text Generation

text-generation-inference

Model card Files Files and versions

codefuse-admin commited on Jan 30, 2024

Commit

8ab8766

·

verified ·

1 Parent(s): a3879ec

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -175,7 +175,7 @@ def load_model_tokenizer(model_path):
     model = AutoGPTQForCausalLM.from_quantized("codefuse-ai/CodeFuse-DeepSeek-33B-4bits",
                                                 inject_fused_attention=False,
                                                 inject_fused_mlp=False,
-                                                use_safetensors=False,
                                                 use_cuda_fp16=True,
                                                 disable_exllama=False,
                                                 device_map='auto'   # Support multi-gpus
@@ -386,7 +386,7 @@ def load_model_tokenizer(model_path):
     model = AutoGPTQForCausalLM.from_quantized("codefuse-ai/CodeFuse-DeepSeek-33B-4bits",
                                                 inject_fused_attention=False,
                                                 inject_fused_mlp=False,
-                                                use_safetensors=False,
                                                 use_cuda_fp16=True,
                                                 disable_exllama=False,
                                                 device_map='auto'   # Support multi-gpus

     model = AutoGPTQForCausalLM.from_quantized("codefuse-ai/CodeFuse-DeepSeek-33B-4bits",
                                                 inject_fused_attention=False,
                                                 inject_fused_mlp=False,
+                                                use_safetensors=True,
                                                 use_cuda_fp16=True,
                                                 disable_exllama=False,
                                                 device_map='auto'   # Support multi-gpus
     model = AutoGPTQForCausalLM.from_quantized("codefuse-ai/CodeFuse-DeepSeek-33B-4bits",
                                                 inject_fused_attention=False,
                                                 inject_fused_mlp=False,
+                                                use_safetensors=True,
                                                 use_cuda_fp16=True,
                                                 disable_exllama=False,
                                                 device_map='auto'   # Support multi-gpus