Spaces:

Leo8613
/

Llama_3.2_Meta

Sleeping

App Files Files Community

Leo8613 commited on Sep 29, 2024

Commit

1b3fa16

verified ·

1 Parent(s): 36476e0

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -33

app.py CHANGED Viewed

@@ -1,60 +1,61 @@
 import gradio as gr
 from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
-# Load the model and tokenizer
-tokenizer = AutoTokenizer.from_pretrained("unsloth/Llama-3.2-1B")
-model = AutoModelForCausalLM.from_pretrained("unsloth/Llama-3.2-1B")
-# Use a pipeline for text generation
-text_gen_pipeline = pipeline("text-generation", model=model, tokenizer=tokenizer)
-# Text generation function with repetition penalty and no_repeat_ngram_size
-def generate_text(prompt, max_length=50, temperature=0.7, top_p=0.9, top_k=50, repetition_penalty=1.2, no_repeat_ngram_size=3):
     generated_text = text_gen_pipeline(prompt,
                                        max_length=max_length,
                                        temperature=temperature,
                                        top_p=top_p,
                                        top_k=top_k,
-                                       repetition_penalty=repetition_penalty,  # Penalty to avoid repetitions
-                                       no_repeat_ngram_size=no_repeat_ngram_size,  # Avoid repeating n-grams
                                        num_return_sequences=1)
     return generated_text[0]['generated_text']
-# Gradio Interface
 with gr.Blocks() as demo:
     gr.Markdown("## Text Generation with Llama 3.2 - 1B")
-    # Input box for user prompt
     prompt_input = gr.Textbox(label="Input (Prompt)", placeholder="Enter your prompt here...")
-    # Slider for maximum text length
-    max_length_input = gr.Slider(minimum=10, maximum=200, value=50, step=10, label="Maximum Length")
-    # Slider for temperature (controls creativity)
-    temperature_input = gr.Slider(minimum=0.1, maximum=1.0, value=0.7, step=0.1, label="Temperature (creativity)")
-    # Slider for top_p (nucleus sampling)
     top_p_input = gr.Slider(minimum=0.1, maximum=1.0, value=0.9, step=0.1, label="Top-p (nucleus sampling)")
-    # Slider for top_k (controls diversity)
-    top_k_input = gr.Slider(minimum=1, maximum=100, value=50, step=1, label="Top-k (sampling diversity)")
-    # Slider for repetition penalty
-    repetition_penalty_input = gr.Slider(minimum=1.0, maximum=2.0, value=1.2, step=0.1, label="Repetition Penalty")
-    # Slider for no_repeat_ngram_size
-    no_repeat_ngram_size_input = gr.Slider(minimum=1, maximum=10, value=3, step=1, label="No Repeat N-Gram Size")
-    # Output box for the generated text
     output_text = gr.Textbox(label="Generated Text")
-    # Submit button
     generate_button = gr.Button("Generate")
-    # Action on button click
     generate_button.click(generate_text,
                           inputs=[prompt_input, max_length_input, temperature_input, top_p_input, top_k_input, repetition_penalty_input, no_repeat_ngram_size_input],
                           outputs=output_text)
-# Launch the app
 demo.launch()

+# Step 2: Import necessary libraries
 import gradio as gr
 from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
+# Step 3: Load the model and tokenizer
+model_name = "unsloth/Llama-3.2-1B"
+try:
+    # Attempt to load the tokenizer and model
+    tokenizer = AutoTokenizer.from_pretrained(model_name)
+    model = AutoModelForCausalLM.from_pretrained(model_name)
+    print(f"Successfully loaded model: {model_name}")
+except Exception as e:
+    # Handle errors and notify the user
+    print(f"Error loading model or tokenizer: {e}")
+    tokenizer = None
+    model = None
+# Step 4: Use a pipeline for text generation if model is loaded
+if model is not None and tokenizer is not None:
+    text_gen_pipeline = pipeline("text-generation", model=model, tokenizer=tokenizer)
+else:
+    text_gen_pipeline = None
+# Step 5: Define the text generation function
+def generate_text(prompt, max_length=40, temperature=0.8, top_p=0.9, top_k=40, repetition_penalty=1.5, no_repeat_ngram_size=4):
+    if text_gen_pipeline is None:
+        return "Model not loaded. Please check the model name or try a different one."
     generated_text = text_gen_pipeline(prompt,
                                        max_length=max_length,
                                        temperature=temperature,
                                        top_p=top_p,
                                        top_k=top_k,
+                                       repetition_penalty=repetition_penalty,
+                                       no_repeat_ngram_size=no_repeat_ngram_size,
                                        num_return_sequences=1)
     return generated_text[0]['generated_text']
+# Step 6: Set up the Gradio interface
 with gr.Blocks() as demo:
     gr.Markdown("## Text Generation with Llama 3.2 - 1B")
+    gr.Markdown("For more details, check out this [Google Colab notebook](https://colab.research.google.com/drive/1TCyQNWMQzsjit_z3-0jHCQYfFTpawh8r#scrollTo=5-6MhJj0ZVpk).")
     prompt_input = gr.Textbox(label="Input (Prompt)", placeholder="Enter your prompt here...")
+    max_length_input = gr.Slider(minimum=10, maximum=200, value=40, step=10, label="Maximum Length")
+    temperature_input = gr.Slider(minimum=0.1, maximum=1.0, value=0.8, step=0.1, label="Temperature (creativity)")
     top_p_input = gr.Slider(minimum=0.1, maximum=1.0, value=0.9, step=0.1, label="Top-p (nucleus sampling)")
+    top_k_input = gr.Slider(minimum=1, maximum=100, value=40, step=1, label="Top-k (sampling diversity)")
+    repetition_penalty_input = gr.Slider(minimum=1.0, maximum=2.0, value=1.5, step=0.1, label="Repetition Penalty")
+    no_repeat_ngram_size_input = gr.Slider(minimum=1, maximum=10, value=4, step=1, label="No Repeat N-Gram Size")
     output_text = gr.Textbox(label="Generated Text")
     generate_button = gr.Button("Generate")
     generate_button.click(generate_text,
                           inputs=[prompt_input, max_length_input, temperature_input, top_p_input, top_k_input, repetition_penalty_input, no_repeat_ngram_size_input],
                           outputs=output_text)
+# Step 7: Launch the app
 demo.launch()