Spaces:

MarvinRoque
/

phi2-gym-bot

Sleeping

App Files Files Community

MarvinRoque commited on Oct 17

Commit

271d7ab

1 Parent(s): c5fd4e7

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -21

app.py CHANGED Viewed

@@ -38,10 +38,8 @@ def normalize_text(text: str) -> str:
 # -------------------------
 # Carregamento de modelos
 # -------------------------
-print("Carregando embedder:", EMBEDDING_MODEL)
 embedder = SentenceTransformer(EMBEDDING_MODEL)
-print("Carregando LLM:", LLM_MODEL)
 tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL, use_fast=True)
 model = AutoModelForCausalLM.from_pretrained(
     LLM_MODEL,
@@ -278,11 +276,8 @@ def detectar_conceitos(prompt: str):
     """
     prompt_norm = normalize_text(prompt or "")
     if not prompt_norm:
-        print("[detectar_conceitos] prompt vazio após normalização")
         return []
-    print(f"\n🟢 [detectar_conceitos] Analisando prompt:\n{prompt_norm}\n")
     # ----------------------------------------
     # 0️⃣ Embedding base do prompt
     # ----------------------------------------
@@ -299,7 +294,6 @@ def detectar_conceitos(prompt: str):
             "source": source
         }
         conceitos_detectados.append(conceito)
-        print(f"✅ [ADD_CONCEITO] {conceito}")
     # ----------------------------------------
     # 1️⃣ Regex base
@@ -553,8 +547,6 @@ def detectar_conceitos(prompt: str):
     max_score = float(sims[max_idx].item())
     domain_str = fitness_domains[max_idx].lower()
-    print(f"🔹 [EMBEDDING] domain='{domain_str}' score={max_score:.3f}")
     if max_score >= THRESHOLD:
         tipo = None
         subtipo = "generico"
@@ -589,7 +581,6 @@ def detectar_conceitos(prompt: str):
     # 4️⃣ Fallback LLM
     # ----------------------------------------
     if not conceitos_detectados:
-        print("⚠️ Nenhum conceito detectado via regex ou embedding, chamando LLM fallback...")
         prompt_llm = f"""
         Analise o texto abaixo e determine:
@@ -610,13 +601,11 @@ def detectar_conceitos(prompt: str):
         inputs = tokenizer(prompt_llm, return_tensors="pt")
         output = model.generate(**inputs, max_new_tokens=128, do_sample=False)
         resposta = tokenizer.decode(output[0], skip_special_tokens=True)
-        print(f"🧠 [LLM RESPOSTA]:\n{resposta}\n")
         match = re.search(r"\{.*\}", resposta, re.S)
         if match:
             try:
                 parsed = json.loads(match.group(0))
-                print(f"🧩 [LLM PARSED] {parsed}")
                 for tipo in ["treino", "nutricao"]:
                     if parsed.get(tipo, False):
                         subtipo = parsed.get(f"{tipo}_subtipo", "generico")
@@ -639,7 +628,6 @@ def detectar_conceitos(prompt: str):
     conceitos_detectados = filtrar_especificos(conceitos_detectados)
-    print(f"🏁 [RESULTADO FINAL] {conceitos_detectados}\n")
     return conceitos_detectados
@@ -1246,7 +1234,6 @@ def extrair_dados_usuario(prompt_norm: str):
         dados["alergias"] = list(set(alergias_encontradas))
     dados["lesoes"]=detectar_lesoes(prompt_norm)
-    print("lesoes: ", dados["lesoes"])
     return dados
@@ -1298,21 +1285,23 @@ def formatar_resposta_humana(resposta_final: dict) -> str:
 # -------------------------
 def responder(prompt: str):
     try:
-        prompt_text = prompt or ""
-        prompt_norm = normalize_text(prompt_text)
-        # 1️⃣ Extrair dados do usuário
-        dados_usuario = extrair_dados_usuario(prompt_norm)
         campos_obrigatorios = ["idade", "sexo", "peso", "altura", "atividade", "objetivo", "nivel_usuario"]
         faltando = [c for c in campos_obrigatorios if c not in dados_usuario]
         if faltando:
-            return f"Preciso que você me diga também: {', '.join(faltando)}."
-        # 2️⃣ Detectar conceitos e intenções
-        conceitos = detectar_conceitos(prompt_text)
         if not conceitos:
-            return "Desculpe, mas o que você digitou não parece se encaixar nos objetivos do app (treino ou nutrição)."
         resposta_final = {}

 # -------------------------
 # Carregamento de modelos
 # -------------------------
 embedder = SentenceTransformer(EMBEDDING_MODEL)
 tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL, use_fast=True)
 model = AutoModelForCausalLM.from_pretrained(
     LLM_MODEL,
     """
     prompt_norm = normalize_text(prompt or "")
     if not prompt_norm:
         return []
     # ----------------------------------------
     # 0️⃣ Embedding base do prompt
     # ----------------------------------------
             "source": source
         }
         conceitos_detectados.append(conceito)
     # ----------------------------------------
     # 1️⃣ Regex base
     max_score = float(sims[max_idx].item())
     domain_str = fitness_domains[max_idx].lower()
     if max_score >= THRESHOLD:
         tipo = None
         subtipo = "generico"
     # 4️⃣ Fallback LLM
     # ----------------------------------------
     if not conceitos_detectados:
         prompt_llm = f"""
         Analise o texto abaixo e determine:
         inputs = tokenizer(prompt_llm, return_tensors="pt")
         output = model.generate(**inputs, max_new_tokens=128, do_sample=False)
         resposta = tokenizer.decode(output[0], skip_special_tokens=True)
         match = re.search(r"\{.*\}", resposta, re.S)
         if match:
             try:
                 parsed = json.loads(match.group(0))
                 for tipo in ["treino", "nutricao"]:
                     if parsed.get(tipo, False):
                         subtipo = parsed.get(f"{tipo}_subtipo", "generico")
     conceitos_detectados = filtrar_especificos(conceitos_detectados)
     return conceitos_detectados
         dados["alergias"] = list(set(alergias_encontradas))
     dados["lesoes"]=detectar_lesoes(prompt_norm)
     return dados
 # -------------------------
 def responder(prompt: str):
     try:
+        # Divide a prompt em duas partes: antes e depois da primeira quebra dupla de linha
+        partes = prompt.split("# PROMPT_USUARIO", 1)
+        dados_brutos = partes[0] if len(partes) > 0 else ""
+        prompt_usuario = partes[1] if len(partes) > 1 else ""
+        dados_norm = normalize_text(dados_brutos)
+        dados_usuario = extrair_dados_usuario(dados_norm)
         campos_obrigatorios = ["idade", "sexo", "peso", "altura", "atividade", "objetivo", "nivel_usuario"]
         faltando = [c for c in campos_obrigatorios if c not in dados_usuario]
         if faltando:
+            return f"Preciso que você configure os seguintes dados: {', '.join(faltando)} nas suas definições de perfil."
+        conceitos = detectar_conceitos(prompt_usuario)
         if not conceitos:
+            return "Desculpe, não entendi o contexto (treino ou nutrição)."
         resposta_final = {}