Spaces:

david-thrower
/

3B-Param-Basic-Chatbot

Build error

david-thrower commited on Aug 2

Commit

ed7e400

verified ·

1 Parent(s): 3e4dc8c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,11 +10,10 @@ print("Loading tokenizer & model…")
 tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
 # model = AutoModelForCausalLM.from_pretrained(MODEL_ID, torch_dtype=torch.bfloat16).to(DEVICE)
-model = AutoModelForCausalLM.from_pretrained(
-    MODEL_ID,
-    # load_in_8bit=True,  # or try load_in_4bit=True
-    # device_map=DEVICE
-)
 #########
@@ -68,7 +67,7 @@ def chat_fn(history, enable_thinking, temperature, top_p, top_k, repetition_pena
         add_generation_prompt=True,
         # xml_tools=TOOLS
     )
-    inputs = tokenizer(text, return_tensors="pt").to(DEVICE)
     with torch.inference_mode():
         streamer = model.generate(
             **inputs,

 tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
 # model = AutoModelForCausalLM.from_pretrained(MODEL_ID, torch_dtype=torch.bfloat16).to(DEVICE)
+model =\
+        AutoModelForCausalLM\
+                .from_pretrained(MODEL_ID, torch_dtype=torch.bfloat16)\
+                .to(DEVICE)
 #########
         add_generation_prompt=True,
         # xml_tools=TOOLS
     )
+    inputs = tokenizer(text, return_tensors="pt")
     with torch.inference_mode():
         streamer = model.generate(
             **inputs,