Spaces:

albhu
/

legalgeek

Runtime error

App Files Files Community

albhu commited on Apr 25, 2024

Commit

2ce8295

verified ·

1 Parent(s): 9e518cd

Update app.py

Browse files

Files changed (1) hide show

app.py +36 -36

app.py CHANGED Viewed

@@ -24,43 +24,39 @@ model = AutoModelForCausalLM.from_pretrained(generator_name, trust_remote_code=T
 document_file = st.file_uploader("Húzd ide a dokumentumot vagy kattints a feltöltéshez", type=["pdf", "docx", "doc"])
 if document_file is not None:
-    # Dokumentum méretének ellenőrzése és részletekben történő feldolgozása
-    if len(document_file.getvalue()) > 10000000:  # 10 MB-nál nagyobb dokumentumok esetén
-        st.error("A dokumentum mérete túl nagy. Kérlek válassz egy kisebb méretű dokumentumot!")
     else:
-        if document_file.type == "application/pdf":
-            # PDF fájl feldolgozása részletekben
-            with pdfplumber.open(document_file) as pdf:
-                document_text = ""
-                for page in pdf.pages:
-                    document_text += page.extract_text()
-        elif document_file.type == "application/vnd.openxmlformats-officedocument.wordprocessingml.document":
-            # DOCX fájl feldolgozása részletekben
-            docx_file = docx.Document(document_file)
-            document_text = ""
-            for paragraph in docx_file.paragraphs:
-                document_text += paragraph.text
-        elif document_file.type == "application/msword":
-            # DOC fájl feldolgozása részletekben
-            doc_file = docx.Document(document_file)
-            document_text = ""
-            for paragraph in doc_file.paragraphs:
-                document_text += paragraph.text
-        else:
-            st.error("A fájltípus nem támogatott. Kérlek válassz ki egy PDF, DOCX vagy DOC fájlt!")
-        # Előző beszélgetésekhez csatolható kontextus
-        context = st.text_area("Korábbi Beszélgetéshez Tartozó Kontextus", "")
-        # Kérdés mező hozzáadása
-        question = st.text_input("Kérdés a Dokumentumból", "")
-        # Válaszgenerálás
-        if st.button("Generálj Választ"):
             if context:
-                input_text = f"{context} {document_text}"
             else:
-                input_text = document_text
             # Ha van kérdés, azt is hozzáadjuk a bemenethez
             if question:
@@ -68,12 +64,16 @@ if document_file is not None:
             # Model használata a válasz generálásához
             response = generate_response(input_text, tokenizer, model)
-            # Válasz megjelenítése
-            st.subheader("Generált Válasz:")
-            st.write(response)
-            # Aktuális beszélgetés hozzáadása az előző beszélgetésekhez
-            st.session_state.previous_conversations.append({"input_text": input_text, "response": response})
 else:
     st.warning("Kérlek válassz ki egy dokumentumfájlt!")

 document_file = st.file_uploader("Húzd ide a dokumentumot vagy kattints a feltöltéshez", type=["pdf", "docx", "doc"])
 if document_file is not None:
+    # Dokumentum méretének ellenőrzése és szeletekre bontása
+    document_chunks = []
+    if document_file.type == "application/pdf":
+        with pdfplumber.open(document_file) as pdf:
+            for page in pdf.pages:
+                document_chunks.append(page.extract_text())
+    elif document_file.type == "application/vnd.openxmlformats-officedocument.wordprocessingml.document":
+        docx_file = docx.Document(document_file)
+        document_text = ""
+        for paragraph in docx_file.paragraphs:
+            document_chunks.append(paragraph.text)
+    elif document_file.type == "application/msword":
+        doc_file = docx.Document(document_file)
+        document_text = ""
+        for paragraph in doc_file.paragraphs:
+            document_chunks.append(paragraph.text)
     else:
+        st.error("A fájltípus nem támogatott. Kérlek válassz ki egy PDF, DOCX vagy DOC fájlt!")
+    # Előző beszélgetésekhez csatolható kontextus
+    context = st.text_area("Korábbi Beszélgetéshez Tartozó Kontextus", "")
+    # Kérdés mező hozzáadása
+    question = st.text_input("Kérdés a Dokumentumból", "")
+    # Válaszgenerálás
+    if st.button("Generálj Választ"):
+        generated_responses = []
+        for chunk in document_chunks:
             if context:
+                input_text = f"{context} {chunk}"
             else:
+                input_text = chunk
             # Ha van kérdés, azt is hozzáadjuk a bemenethez
             if question:
             # Model használata a válasz generálásához
             response = generate_response(input_text, tokenizer, model)
+            generated_responses.append(response)
+        # Összefésüljük a válaszokat egyetlen szöveggé
+        final_response = " ".join(generated_responses)
+        # Válasz megjelenítése
+        st.subheader("Generált Válasz:")
+        st.write(final_response)
+        # Aktuális beszélgetés hozzáadása az előző beszélgetésekhez
+        st.session_state.previous_conversations.append({"input_text": input_text, "response": final_response})
 else:
     st.warning("Kérlek válassz ki egy dokumentumfájlt!")