Spaces:

teixeiramg
/

Teste

Sleeping

App Files Files Community

teixeiramg commited on Nov 5, 2024

Commit

bbcd85b

verified ·

1 Parent(s): 71c21c0

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -27

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import fitz  # PyMuPDF
-import os
 # Carregar o tokenizer e o modelo
 tokenizer = AutoTokenizer.from_pretrained("Locutusque/gpt2-xl-conversational")
@@ -12,40 +12,56 @@ pdf_content = ""
 # Função para ler o PDF
 def read_pdf(file_path):
-    doc = fitz.open(file_path)
-    text = ""
-    for page_num in range(len(doc)):
-        page = doc.load_page(page_num)
-        text += page.get_text()
-    return text
 # Função para carregar o PDF e armazenar o conteúdo
 def load_pdf(pdf_file):
     global pdf_content
-    pdf_path = pdf_file.name  # Acessar o caminho do arquivo carregado
-    pdf_content = read_pdf(pdf_path)
-    if pdf_content:
-        return "PDF carregado com sucesso!"
-    else:
-        return "Falha ao carregar o PDF."
 # Função para responder perguntas com base no conteúdo do PDF
 def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0.95):
     global pdf_content
-    if not pdf_content:
-        return "Por favor, carregue um PDF primeiro.", ""
-    prompt = f"Conteúdo do PDF: {pdf_content}\nPergunta: {question}\nResposta em português:"
-    inputs = tokenizer(prompt, return_tensors="pt")
-    outputs = model.generate(
-        inputs.input_ids,
-        max_length=max_length,
-        temperature=temperature,
-        top_k=top_k,
-        top_p=top_p,
-        num_return_sequences=1
-    )
-    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return response, prompt
 # Interface do Gradio para carregar PDF e fazer perguntas
 pdf_loader = gr.Interface(

 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import fitz  # PyMuPDF
+import traceback
 # Carregar o tokenizer e o modelo
 tokenizer = AutoTokenizer.from_pretrained("Locutusque/gpt2-xl-conversational")
 # Função para ler o PDF
 def read_pdf(file_path):
+    try:
+        doc = fitz.open(file_path)
+        text = ""
+        for page_num in range(len(doc)):
+            page = doc.load_page(page_num)
+            text += page.get_text()
+        return text
+    except Exception as e:
+        print(f"Erro ao ler o PDF: {e}")
+        print(traceback.format_exc())
+        return ""
 # Função para carregar o PDF e armazenar o conteúdo
 def load_pdf(pdf_file):
     global pdf_content
+    try:
+        pdf_path = pdf_file.name  # Acessar o caminho do arquivo carregado
+        pdf_content = read_pdf(pdf_path)
+        if pdf_content:
+            return "PDF carregado com sucesso!"
+        else:
+            return "Falha ao carregar o PDF."
+    except Exception as e:
+        print(f"Erro ao carregar o PDF: {e}")
+        print(traceback.format_exc())
+        return "Erro ao carregar o PDF."
 # Função para responder perguntas com base no conteúdo do PDF
 def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0.95):
     global pdf_content
+    try:
+        if not pdf_content:
+            return "Por favor, carregue um PDF primeiro.", ""
+        prompt = f"Conteúdo do PDF: {pdf_content}\nPergunta: {question}\nResposta em português:"
+        print(f"Prompt: {prompt}")  # Adicionar log para depuração
+        inputs = tokenizer(prompt, return_tensors="pt")
+        outputs = model.generate(
+            inputs.input_ids,
+            max_length=max_length,
+            temperature=temperature,
+            top_k=top_k,
+            top_p=top_p,
+            num_return_sequences=1
+        )
+        response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        return response, prompt
+    except Exception as e:
+        print(f"Erro ao gerar resposta: {e}")
+        print(traceback.format_exc())
+        return "Erro ao gerar resposta.", prompt
 # Interface do Gradio para carregar PDF e fazer perguntas
 pdf_loader = gr.Interface(