Spaces:

Remostart
/

Cardano_7B

Runtime error

Remostart commited on Sep 7

Commit

f2ab72d

verified ·

1 Parent(s): 2984b8e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
-from spaces import GPU
 import logging
 # Set up logging
@@ -38,14 +38,14 @@ if tokenizer.pad_token_id is None:
     logger.info("Set pad_token_id to eos_token_id.")
 def load_model():
-    """Load model inside GPU context to enable quantization."""
     global model
     if model is None:
         try:
             logger.info("Loading model with CPU fallback (full precision)...")
             model = AutoModelForCausalLM.from_pretrained(
                 MODEL_NAME,
-                torch_dtype=torch.float16,  # Use fp16 for memory efficiency without bitsandbytes
                 low_cpu_mem_usage=True,
                 trust_remote_code=True,
             )

 import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
+import spaces  # Explicit import for GPU decorator
 import logging
 # Set up logging
     logger.info("Set pad_token_id to eos_token_id.")
 def load_model():
+    """Load model inside GPU context."""
     global model
     if model is None:
         try:
             logger.info("Loading model with CPU fallback (full precision)...")
             model = AutoModelForCausalLM.from_pretrained(
                 MODEL_NAME,
+                torch_dtype=torch.float16,  # Use fp16 for memory efficiency
                 low_cpu_mem_usage=True,
                 trust_remote_code=True,
             )