Spaces:

ceadibc
/

Benjamin

Sleeping

App Files Files Community

ceadibc commited on Jul 29

Commit

0251b38

verified ·

1 Parent(s): b57176d

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -23

app.py CHANGED Viewed

@@ -2,48 +2,54 @@ import os
 import gradio as gr
 from huggingface_hub import InferenceClient
-# Cliente com token seguro vindo dos "secrets"
 client = InferenceClient(
     model="mistralai/Mistral-7B-Instruct-v0.3",
     token=os.getenv("HF_TOKEN")
 )
-# Função para processar a conversa
 def responder(mensagem, historico):
-    historico = historico or []
-    # Formata o histórico como contexto
-    contexto = ""
-    for user_msg, bot_msg in historico:
-        contexto += f"<s>[INST] {user_msg} [/INST] {bot_msg} </s>\n"
-    contexto += f"<s>[INST] {mensagem} [/INST]"
     resposta = ""
     try:
-        for token in client.text_generation_stream(
-            prompt=contexto,
-            max_new_tokens=300,
-            temperature=0.4,
-            top_p=0.8,
-            stop_sequences=["</s>"],
-        ):
-            resposta += token
-            yield resposta
     except Exception as e:
-        print(f"Erro ao gerar resposta: {e}")
-        yield "Ocorreu um erro ao gerar a resposta."
     if not resposta.strip():
         yield "Nenhuma resposta gerada. Tente novamente."
-# Interface do chat com labels em português
 demo = gr.ChatInterface(
     responder,
-    type="messages",
     title="Benjamin – Assistente Virtual da CEaD - IBC",
     description="Tire dúvidas com minha inteligência artificial (minha base de dados vai até 2021)",
-    # sem retry_btn, undo_btn, clear_btn
 )
 if __name__ == "__main__":

 import gradio as gr
 from huggingface_hub import InferenceClient
+# Cliente com token seguro
 client = InferenceClient(
     model="mistralai/Mistral-7B-Instruct-v0.3",
     token=os.getenv("HF_TOKEN")
 )
+# Função de resposta no estilo chat
 def responder(mensagem, historico):
+    mensagens = []
+    if historico is None:
+        historico = []
+    for entrada in historico:
+        if isinstance(entrada, list) and len(entrada) == 2:
+            mensagens.append({"role": "user", "content": entrada[0]})
+            mensagens.append({"role": "assistant", "content": entrada[1]})
+    mensagens.append({"role": "user", "content": mensagem})
     resposta = ""
     try:
+        resposta_stream = client.chat_completion(
+            messages=mensagens,
+            temperature=0.5,
+            max_tokens=500,
+            stream=True,
+        )
+        for parte in resposta_stream:
+            token = parte.get("choices", [{}])[0].get("delta", {}).get("content", "")
+            if token:
+                resposta += token
+                yield resposta
     except Exception as e:
+        print(f"[ERRO] Falha ao consultar modelo: {e}")
+        yield "Ocorreu um erro ao gerar a resposta. Verifique o modelo ou o token."
     if not resposta.strip():
         yield "Nenhuma resposta gerada. Tente novamente."
+# Interface Gradio
 demo = gr.ChatInterface(
     responder,
     title="Benjamin – Assistente Virtual da CEaD - IBC",
     description="Tire dúvidas com minha inteligência artificial (minha base de dados vai até 2021)",
+    textbox=gr.Textbox(placeholder="Digite uma mensagem e tecle Enter"),
+    type="messages"
 )
 if __name__ == "__main__":