Spaces:

teixeiramg
/

Teste

Sleeping

teixeiramg commited on Nov 5, 2024

Commit

5624aa2

verified ·

1 Parent(s): 926ff69

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,12 +1,27 @@
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Carregar o tokenizer e o modelo
 tokenizer = AutoTokenizer.from_pretrained("Locutusque/gpt2-xl-conversational")
 model = AutoModelForCausalLM.from_pretrained("Locutusque/gpt2-xl-conversational")
-# Função para gerar respostas
-def generate_response(prompt, max_length=100, temperature=0.7, top_k=50, top_p=0.95):
     inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(
         inputs.input_ids,
@@ -20,7 +35,12 @@ def generate_response(prompt, max_length=100, temperature=0.7, top_k=50, top_p=0
     return response
 # Interface do Gradio
-iface = gr.Interface(fn=generate_response, inputs="text", outputs="text", title="GPT-2 Conversational")
 if __name__ == "__main__":
     iface.launch()

 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
+import fitz  # PyMuPDF
 # Carregar o tokenizer e o modelo
 tokenizer = AutoTokenizer.from_pretrained("Locutusque/gpt2-xl-conversational")
 model = AutoModelForCausalLM.from_pretrained("Locutusque/gpt2-xl-conversational")
+# Função para ler o PDF
+def read_pdf(file_path):
+    doc = fitz.open(file_path)
+    text = ""
+    for page_num in range(len(doc)):
+        page = doc.load_page(page_num)
+        text += page.get_text()
+    return text
+# Função para gerar respostas a partir do texto do PDF
+def generate_response_from_pdf(pdf_file, max_length=200, temperature=0.7, top_k=50, top_p=0.95):
+    # Lê o conteúdo do PDF
+    pdf_text = read_pdf(pdf_file.name)
+    # Gerar prompt em português
+    prompt = f"Texto do PDF: {pdf_text}\nResposta em português:"
+    # Gera a resposta usando o texto do PDF como prompt
     inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(
         inputs.input_ids,
     return response
 # Interface do Gradio
+iface = gr.Interface(
+    fn=generate_response_from_pdf,
+    inputs=gr.inputs.File(label="Carregue um PDF"),
+    outputs="text",
+    title="GPT-2 Conversational com PDF em Português"
+)
 if __name__ == "__main__":
     iface.launch()