Spaces:

Remostart
/

Cardano_7B

Sleeping

Remostart commited on Sep 7

Commit

feafa8c

verified ·

1 Parent(s): 39ff65e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,16 +1,21 @@
 import gradio as gr
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer
-from spaces import GPU  # Import ZeroGPU decorator
-# Load model & tokenizer (runs on CPU at startup)
 MODEL_NAME = "ubiodee/plutus_llm"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=False)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
-    torch_dtype=torch.float16,
     device_map="auto",
-    load_in_8bit=True
 )
 # Set padding token

 import gradio as gr
 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
+from spaces import GPU
+# Load model & tokenizer
 MODEL_NAME = "ubiodee/plutus_llm"
+quantization_config = BitsAndBytesConfig(
+    load_in_8bit=True,
+    bnb_8bit_compute_dtype=torch.float16,
+    bnb_8bit_use_double_quant=True
+)
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=False)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
+    quantization_config=quantization_config,
     device_map="auto",
+    torch_dtype=torch.float16
 )
 # Set padding token