Spaces:

IA2
/

IA2_model

Sleeping

App Files Files Community

AshenClock commited on Jan 3

Commit

a264007

verified ·

1 Parent(s): ff8bfcc

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -10

app.py CHANGED Viewed

@@ -17,7 +17,7 @@ load_dotenv()
 # Configura il logging
 logging.basicConfig(
-    level=logging.DEBUG,
     format="%(asctime)s - %(levelname)s - %(message)s",
     handlers=[logging.FileHandler("app.log"), logging.StreamHandler()]
 )
@@ -35,7 +35,7 @@ client = InferenceClient(token=API_KEY)
 # Definisci i percorsi dei file
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 RDF_FILE = os.path.join(BASE_DIR, "Ontologia.rdf")
-HF_MODEL = "Qwen/Qwen2.5-72B-Instruct"
 MAX_CLASSES = 30
 MAX_PROPERTIES = 30
@@ -171,7 +171,7 @@ def prepare_retrieval():
     else:
         logger.info(f"File RDF trovato: {RDF_FILE}")
-    # Verifica se documents.json esiste, altrimenti generalo
     if not os.path.exists(DOCUMENTS_FILE):
         logger.info(f"File {DOCUMENTS_FILE} non trovato. Estrazione dell'ontologia.")
         try:
@@ -182,7 +182,7 @@ def prepare_retrieval():
     else:
         logger.info(f"File {DOCUMENTS_FILE} trovato.")
-    # Verifica se faiss.index esiste, altrimenti crealo
     if not os.path.exists(FAISS_INDEX_FILE):
         logger.info(f"File {FAISS_INDEX_FILE} non trovato. Creazione dell'indice FAISS.")
         try:
@@ -307,11 +307,11 @@ REGOLE STRINGENTI:
 4) Se la domanda è generica (tipo 'Ciao, come stai?'), rispondi breve.
 5) Se trovi risultati, la risposta finale deve essere la query SPARQL (una sola riga).
 6) Se non trovi nulla, rispondi con 'Nessuna info.'
-7) Non multiline. Esempio: PREFIX base: <...> SELECT ?x WHERE {{ ... }}.
 Esempio:
 Utente: Chi ha creato l'opera 'Amore e Psiche'?
-Risposta: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#> SELECT ?creatore WHERE {{ ?opera base:hasName "Amore e Psiche" . ?opera base:creatoDa ?creatore . }}
 FINE REGOLE
 """
@@ -324,7 +324,7 @@ Ho ottenuto questi risultati SPARQL:
 Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare oltre i risultati.
 """
-async def call_hf_model(prompt: str, temperature=0.5, max_tokens=1024) -> str:
     """Chiama il modello Hugging Face e gestisce la risposta."""
     logger.debug("Chiamo HF con il seguente prompt:")
     content_preview = (prompt[:300] + '...') if len(prompt) > 300 else prompt
@@ -332,15 +332,17 @@ async def call_hf_model(prompt: str, temperature=0.5, max_tokens=1024) -> str:
     try:
         resp = client.text_generation(
             model=HF_MODEL,
-            inputs=prompt,
             parameters={
                 "temperature": temperature,
                 "max_new_tokens": max_tokens,
                 "top_p": 0.9
             }
         )
-        # La struttura della risposta dipende dall'API; verifica se "generated_text" è il campo corretto
-        raw = resp["generated_text"]
         # Forza la risposta su una singola linea se multilinea
         single_line = " ".join(raw.splitlines())
         logger.debug(f"Risposta HF single-line: {single_line}")

 # Configura il logging
 logging.basicConfig(
+    level=logging.INFO,  # Riduci il livello di logging per migliorare le prestazioni
     format="%(asctime)s - %(levelname)s - %(message)s",
     handlers=[logging.FileHandler("app.log"), logging.StreamHandler()]
 )
 # Definisci i percorsi dei file
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 RDF_FILE = os.path.join(BASE_DIR, "Ontologia.rdf")
+HF_MODEL = "Qwen/Qwen2.5-72B-Instruct"  # Assicurati che il modello sia supportato
 MAX_CLASSES = 30
 MAX_PROPERTIES = 30
     else:
         logger.info(f"File RDF trovato: {RDF_FILE}")
+    # Verifica se documents.json esiste, altrimenti generarlo
     if not os.path.exists(DOCUMENTS_FILE):
         logger.info(f"File {DOCUMENTS_FILE} non trovato. Estrazione dell'ontologia.")
         try:
     else:
         logger.info(f"File {DOCUMENTS_FILE} trovato.")
+    # Verifica se faiss.index esiste, altrimenti crearlo
     if not os.path.exists(FAISS_INDEX_FILE):
         logger.info(f"File {FAISS_INDEX_FILE} non trovato. Creazione dell'indice FAISS.")
         try:
 4) Se la domanda è generica (tipo 'Ciao, come stai?'), rispondi breve.
 5) Se trovi risultati, la risposta finale deve essere la query SPARQL (una sola riga).
 6) Se non trovi nulla, rispondi con 'Nessuna info.'
+7) Non multiline. Esempio: PREFIX base: <...> SELECT ?x WHERE { ... }.
 Esempio:
 Utente: Chi ha creato l'opera 'Amore e Psiche'?
+Risposta: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#> SELECT ?creatore WHERE { ?opera base:hasName "Amore e Psiche" . ?opera base:creatoDa ?creatore . }
 FINE REGOLE
 """
 Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare oltre i risultati.
 """
+async def call_hf_model(prompt: str, temperature: float = 0.5, max_tokens: int = 1024) -> str:
     """Chiama il modello Hugging Face e gestisce la risposta."""
     logger.debug("Chiamo HF con il seguente prompt:")
     content_preview = (prompt[:300] + '...') if len(prompt) > 300 else prompt
     try:
         resp = client.text_generation(
             model=HF_MODEL,
+            prompt,  # Passa il prompt come argomento posizionale
             parameters={
                 "temperature": temperature,
                 "max_new_tokens": max_tokens,
                 "top_p": 0.9
             }
         )
+        # La struttura della risposta potrebbe variare; verifica il campo corretto
+        raw = resp.get("generated_text", "")
+        if not raw:
+            raise ValueError("Nessun testo generato dal modello.")
         # Forza la risposta su una singola linea se multilinea
         single_line = " ".join(raw.splitlines())
         logger.debug(f"Risposta HF single-line: {single_line}")