Spaces:

ceadibc
/

Benjamin

Sleeping

App Files Files Community

ceadibc commited on Sep 1

Commit

97b2894

verified ·

1 Parent(s): f31a9f0

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -29

app.py CHANGED Viewed

@@ -1,29 +1,34 @@
 import gradio as gr
 from huggingface_hub import InferenceClient
-import os # Para gerenciar tokens do Hugging Face (opcional, mas recomendado)
 import sys
 print(f"Versão do Python: {sys.version}")
 print(f"Versão do Gradio: {gr.__version__}")
-# Cliente de inferência com o modelo google/gemma-7b-it
 # Você pode precisar de um token de acesso do Hugging Face (HUGGING_FACE_HUB_TOKEN)
 # para evitar limites de taxa mais baixos ou se o modelo tiver restrições de acesso.
 # Obtenha um token em: https://huggingface.co/settings/tokens
 # Ex: export HUGGING_FACE_HUB_TOKEN="hf_SUA_CHAVE_AQUI"
 HUGGING_FACE_TOKEN = os.getenv("HUGGING_FACE_HUB_TOKEN")
 client = InferenceClient(
-    model="google/gemma-7b-it", # Alterado para google/gemma-7b-it
-    token=HUGGING_FACE_TOKEN # Passe o token aqui (pode ser None se não tiver um)
 )
-# Função para processar a conversa (adaptada para o formato do Hugging Face)
 def responder_gemma(mensagem, historico):
     mensagens = []
     if historico is None:
         historico = []
-    # Adiciona o histórico da conversa
     for item in historico:
         if isinstance(item, list) and len(item) == 2:
             user_msg, bot_msg = item
@@ -33,54 +38,61 @@ def responder_gemma(mensagem, historico):
     # Adiciona a mensagem atual do usuário
     mensagens.append({"role": "user", "content": mensagem})
-    resposta = ""
     try:
-        # A API de chat_completion do Hugging Face é compatível com o formato OpenAI
         for mensagem_chunk in client.chat_completion(
-            messages=mensagens, # O parâmetro é 'messages' para o InferenceClient
-            max_tokens=300,
-            stream=True,
-            temperature=0.7, # Ajuste a temperatura para um pouco mais de criatividade
-            top_p=0.9,       # Ajuste top_p para focar em palavras mais prováveis
         ):
             if not mensagem_chunk or not isinstance(mensagem_chunk, dict):
                 continue
             try:
                 # Extrai o conteúdo da resposta do chunk
                 conteudo = mensagem_chunk["choices"][0]["delta"].get("content", "")
-                if conteudo.strip():
                     resposta += conteudo
                     yield resposta # Envia a resposta parcial para a interface do Gradio
             except (AttributeError, IndexError, KeyError) as e:
                 print(f"Erro ao processar mensagem do chunk: {e}")
-                continue # Continua para o próximo chunk se houver erro neste
     except Exception as e:
         print(f"Erro inesperado ao chamar a API do Hugging Face com Gemma: {e}")
-        yield "Ocorreu um erro ao gerar a resposta. Tente novamente."
     if not resposta.strip():
-        yield "Nenhuma resposta gerada. Tente novamente."
-# Interface do chat com labels em português
 demo = gr.ChatInterface(
-    responder_gemma, # Usar a nova função para Gemma
-    title="Benjamin – Assistente Virtual da CEaD - IBC (Gemma-7B-IT)",
-    textbox=gr.Textbox(placeholder="Digite uma mensagem e depois tecle Enter"),
-    examples=[
-        "O que é o Instituto Benjamin Constant?",
         "Qual a missão da CEaD?",
         "Quem foi Louis Braille?",
         "Qual a importância da educação inclusiva?"
     ],
-    theme="soft",
-    fill_height=True,
-    retry_btn="Tentar novamente",
-    undo_btn="Desfazer",
-    clear_btn="Limpar conversa"
 )
 if __name__ == "__main__":
-    demo.launch()

 import gradio as gr
 from huggingface_hub import InferenceClient
+import os
 import sys
+# --- Verificações de versão para depuração ---
 print(f"Versão do Python: {sys.version}")
 print(f"Versão do Gradio: {gr.__version__}")
+# -------------------------------------------
+# Configuração do Cliente de Inferência do Hugging Face
+# Modelo: google/gemma-7b-it
 # Você pode precisar de um token de acesso do Hugging Face (HUGGING_FACE_HUB_TOKEN)
 # para evitar limites de taxa mais baixos ou se o modelo tiver restrições de acesso.
 # Obtenha um token em: https://huggingface.co/settings/tokens
+# Recomenda-se armazenar o token como uma variável de ambiente:
 # Ex: export HUGGING_FACE_HUB_TOKEN="hf_SUA_CHAVE_AQUI"
 HUGGING_FACE_TOKEN = os.getenv("HUGGING_FACE_HUB_TOKEN")
 client = InferenceClient(
+    model="google/gemma-7b-it",
+    token=HUGGING_FACE_TOKEN # Será None se a variável de ambiente não estiver definida
 )
+# Função para processar a conversa com o modelo Gemma
 def responder_gemma(mensagem, historico):
     mensagens = []
     if historico is None:
         historico = []
+    # Constrói o histórico da conversa no formato esperado pela API de chat do Hugging Face
     for item in historico:
         if isinstance(item, list) and len(item) == 2:
             user_msg, bot_msg = item
     # Adiciona a mensagem atual do usuário
     mensagens.append({"role": "user", "content": mensagem})
+    resposta = "" # Variável para acumular a resposta do modelo
     try:
+        # Chama a API de chat_completion do Hugging Face com o modelo Gemma
+        # O stream=True permite que a resposta seja construída e exibida em tempo real
         for mensagem_chunk in client.chat_completion(
+            messages=mensagens, # O parâmetro é 'messages'
+            max_tokens=300,     # Limite de tokens na resposta do modelo
+            stream=True,        # Ativa o streaming da resposta
+            temperature=0.7,    # Controla a aleatoriedade da resposta (0.0 a 1.0)
+            top_p=0.9,          # Controla a diversidade da resposta (0.0 a 1.0)
         ):
+            # Verifica se o chunk da mensagem é válido
             if not mensagem_chunk or not isinstance(mensagem_chunk, dict):
                 continue
             try:
                 # Extrai o conteúdo da resposta do chunk
                 conteudo = mensagem_chunk["choices"][0]["delta"].get("content", "")
+                if conteudo.strip(): # Se houver conteúdo válido
                     resposta += conteudo
                     yield resposta # Envia a resposta parcial para a interface do Gradio
             except (AttributeError, IndexError, KeyError) as e:
+                # Captura erros ao processar um chunk específico (ex: formato inesperado)
                 print(f"Erro ao processar mensagem do chunk: {e}")
+                continue # Continua para o próximo chunk
     except Exception as e:
+        # Captura erros gerais na chamada da API (ex: problema de conexão, token inválido)
         print(f"Erro inesperado ao chamar a API do Hugging Face com Gemma: {e}")
+        yield "Ocorreu um erro ao gerar a resposta. Por favor, tente novamente mais tarde."
+    # Mensagem de fallback se nenhuma resposta for gerada
     if not resposta.strip():
+        yield "Nenhuma resposta gerada. Por favor, tente novamente."
+# Definição da interface do chat com Gradio
 demo = gr.ChatInterface(
+    responder_gemma, # A função que processa as mensagens do chat
+    title="Benjamin – Assistente Virtual da CEaD - IBC (Gemma-7B-IT)", # Título da interface
+    textbox=gr.Textbox(placeholder="Digite uma mensagem e depois tecle Enter", container=False, scale=7), # Configurações da caixa de texto
+    examples=[ # Exemplos de perguntas para facilitar o teste
+        "O que é o IBC?",
         "Qual a missão da CEaD?",
         "Quem foi Louis Braille?",
         "Qual a importância da educação inclusiva?"
     ],
+    theme="soft", # Tema visual da interface
+    fill_height=True, # Preenche a altura disponível
+    retry_btn="Tentar novamente", # Botão para tentar a última pergunta novamente
+    undo_btn="Desfazer",         # Botão para desfazer a última interação
+    clear_btn="Limpar conversa"  # Botão para limpar todo o histórico da conversa
 )
+# Lança a interface do Gradio quando o script é executado
 if __name__ == "__main__":
+    demo.launch()