Spaces:

joackoEsp
/

Solid-ALIA

Paused

App Files Files Community

joackoEsp commited on Mar 2

Commit

b08158b

verified ·

1 Parent(s): 44005d4

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -22

app.py CHANGED Viewed

@@ -2,43 +2,47 @@ import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-# Cargar el modelo y el tokenizador
 model_name = "BSC-LT/salamandra-2b"
-if "model" not in globals():
     tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
     tokenizer.pad_token = tokenizer.eos_token  # 🔹 Evita errores de atención
-    model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
-# Función de generación optimizada
-def generate_response(prompt):
-    system_prompt = "Responde solo con el texto solicitado, sin información personal ni datos irrelevantes."
-    inputs = tokenizer(
-        f"Instrucción: {system_prompt} \n Pregunta: {prompt} \n Respuesta directa:",
-        return_tensors="pt",
-        padding=True  # 🔹 Evita respuestas inconsistentes
     )
     outputs = model.generate(
         inputs.input_ids,
-        attention_mask=inputs.attention_mask,  # 🔹 Asegura que el modelo procese correctamente la entrada
-        max_new_tokens=50,  # 🔹 Control preciso sobre la generación
-        do_sample=True,
-        temperature=0.45,  # 🔹 Reduce la aleatoriedad sin hacer respuestas robóticas
-        top_p=0.9,  # 🔹 Más fluidez y control en la elección de palabras
-        repetition_penalty=1.1,  # 🔹 Evita repeticiones innecesarias
-        early_stopping=False,  # 🔹 Ajustado para evitar la advertencia en Hugging Face
     )
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
 # Interfaz en Gradio
 with gr.Blocks() as demo:
-    gr.Markdown("# 🧠 Chatbot SOLID&ALIA - Optimizado con Instrucciones Claras")
-    input_text = gr.Textbox(label="Escribe tu texto aquí")
-    output_text = gr.Textbox(label="Respuesta de ALIA")
-    submit_button = gr.Button("Generar respuesta")
-    submit_button.click(generate_response, inputs=input_text, outputs=output_text)
 demo.launch()

 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
+# Cargar el modelo y el tokenizador solo una vez para evitar recargas
 model_name = "BSC-LT/salamandra-2b"
+if "tokenizer" not in globals():
     tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
     tokenizer.pad_token = tokenizer.eos_token  # 🔹 Evita errores de atención
+if "model" not in globals():
+    model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
+    model.eval()  # 🔹 Optimiza la inferencia para que sea más rápida
+# Función exclusiva para humanización de texto
+def humanize_text(input_text):
+    system_prompt = (
+        "Reescribe el siguiente texto para que sea más natural y humano, "
+        "sin cambiar su significado ni añadir información nueva. Usa un lenguaje claro y fluido."
     )
+    prompt = f"{system_prompt}\n\nTexto original: {input_text}\n\nTexto humanizado:"
+    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True)
     outputs = model.generate(
         inputs.input_ids,
+        attention_mask=inputs.attention_mask,
+        max_new_tokens=100,  # 🔹 Se aumenta para evitar cortes en textos largos
+        do_sample=True,  # 🔹 Mantiene variabilidad en la reescritura
+        temperature=0.6,  # 🔹 Da un poco más de flexibilidad en la generación
+        top_p=0.9,  # 🔹 Mantiene coherencia en la reescritura
+        repetition_penalty=1.1,  # 🔹 Evita respuestas repetitivas
+        early_stopping=True,
     )
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
 # Interfaz en Gradio
 with gr.Blocks() as demo:
+    gr.Markdown("# ✍️ Humanización de Texto con ALIA")
+    input_text = gr.Textbox(label="Pega aquí el texto generado por IA para humanizar")
+    output_text = gr.Textbox(label="Texto humanizado por ALIA", interactive=False)
+    submit_button = gr.Button("Humanizar Texto")
+    submit_button.click(humanize_text, inputs=input_text, outputs=output_text)
 demo.launch()