Spaces:

IA2
/

IA2_model

Sleeping

App Files Files Community

AshenClock commited on Jan 3

Commit

b6960a0

verified ·

1 Parent(s): f59396d

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -27

app.py CHANGED Viewed

@@ -5,12 +5,12 @@ from pydantic import BaseModel
 from fastapi import FastAPI, HTTPException
 import rdflib
 from rdflib import RDF, RDFS, OWL
-from huggingface_hub import InferenceClient
 from sentence_transformers import SentenceTransformer
 import faiss
 import json
 import numpy as np
 from dotenv import load_dotenv
 # Carica le variabili d'ambiente
 load_dotenv()
@@ -29,9 +29,6 @@ if not API_KEY:
     logger.error("HF_API_KEY non impostata.")
     raise EnvironmentError("HF_API_KEY non impostata.")
-# Inizializza InferenceClient
-client = InferenceClient(token=API_KEY)
 # Definisci i percorsi dei file
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 RDF_FILE = os.path.join(BASE_DIR, "Ontologia.rdf")
@@ -136,7 +133,7 @@ def create_faiss_index(documents_file: str, index_file: str, embedding_model: st
         with open(documents_file, "r", encoding="utf-8") as f:
             document = json.load(f)
         logger.info(f"Documento caricato da {documents_file}.")
         # Genera embedding
         model = SentenceTransformer(embedding_model)
         # Concatenazione delle classi, proprietà e entità per l'embedding
@@ -145,13 +142,13 @@ def create_faiss_index(documents_file: str, index_file: str, embedding_model: st
         texts += [f"Entità: {entity['label']}. Descrizione: {entity['description']}. Proprietà: {entity['properties']}" for entity in document.get('entities', [])]
         embeddings = model.encode(texts, convert_to_numpy=True)
         logger.info("Embedding generati con SentenceTransformer.")
         # Crea l'indice FAISS
         dimension = embeddings.shape[1]
         index = faiss.IndexFlatL2(dimension)
         index.add(embeddings)
         logger.info(f"Indice FAISS creato con dimensione: {dimension}.")
         # Salva l'indice
         faiss.write_index(index, index_file)
         logger.info(f"Indice FAISS salvato in {index_file}.")
@@ -257,25 +254,25 @@ def retrieve_relevant_documents(query: str, top_k: int = 5):
         with open(DOCUMENTS_FILE, "r", encoding="utf-8") as f:
             document = json.load(f)
         logger.info(f"Documento caricato da {DOCUMENTS_FILE}.")
         # Carica l'indice FAISS
         index = faiss.read_index(FAISS_INDEX_FILE)
         logger.info(f"Indice FAISS caricato da {FAISS_INDEX_FILE}.")
         # Genera embedding della query
         model = SentenceTransformer('all-MiniLM-L6-v2')
         query_embedding = model.encode([query], convert_to_numpy=True)
         logger.info("Embedding della query generati.")
         # Ricerca nell'indice
         distances, indices = index.search(query_embedding, top_k)
         logger.info(f"Ricerca FAISS completata. Risultati ottenuti: {len(indices[0])}")
         # Concatenazione delle descrizioni per la ricerca
         texts = [f"Classe: {cls['label']}. Descrizione: {cls['description']}" for cls in document['classes']]
         texts += [f"Proprietà: {prop['label']}. Descrizione: {prop['description']}" for prop in document['properties']]
         texts += [f"Entità: {entity['label']}. Descrizione: {entity['description']}. Proprietà: {entity['properties']}" for entity in document.get('entities', [])]
         # Recupera i testi rilevanti
         relevant_texts = [texts[idx] for idx in indices[0] if idx < len(texts)]
         retrieved_docs = "\n".join(relevant_texts)
@@ -291,7 +288,7 @@ def create_system_message(ont_text: str, retrieved_docs: str) -> str:
     informazioni recuperate tramite RAG.
     """
     return f"""
-Sei un assistente museale esperto in ontologie RDF. Utilizza le informazioni fornite per generare query SPARQL precise e pertinenti. Ecco un estratto di CLASSI, PROPRIETÀ ed ENTITÀ dell'ontologia (senza NamedIndividuals):
 --- ONTOLOGIA ---
 {ont_text}
 --- FINE ---
@@ -325,30 +322,47 @@ Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare
 """
 async def call_hf_model(prompt: str, temperature: float = 0.5, max_tokens: int = 1024) -> str:
-    """Chiama il modello Hugging Face e gestisce la risposta."""
     logger.debug("Chiamo HF con il seguente prompt:")
     content_preview = (prompt[:300] + '...') if len(prompt) > 300 else prompt
     logger.debug(f"PROMPT => {content_preview}")
     try:
-        resp = client.text_generation(
-            HF_MODEL,  # Argomento posizionale: modello
-            prompt,     # Argomento posizionale: input
-            parameters={
-                "temperature": temperature,
-                "max_new_tokens": max_tokens,
-                "top_p": 0.9
-            }
         )
-        logger.debug(f"Risposta completa dal modello: {resp}")
-        raw = resp.get("generated_text", "")
-        if not raw:
-            raise ValueError("Nessun testo generato dal modello.")
         # Forza la risposta su una singola linea se multilinea
         single_line = " ".join(raw.splitlines())
         logger.debug(f"Risposta HF single-line: {single_line}")
         return single_line.strip()
     except Exception as e:
-        logger.error(f"HuggingFace error: {e}")
         raise HTTPException(status_code=500, detail=str(e))
 # Prepara i file necessari per RAG

 from fastapi import FastAPI, HTTPException
 import rdflib
 from rdflib import RDF, RDFS, OWL
 from sentence_transformers import SentenceTransformer
 import faiss
 import json
 import numpy as np
 from dotenv import load_dotenv
+import requests
 # Carica le variabili d'ambiente
 load_dotenv()
     logger.error("HF_API_KEY non impostata.")
     raise EnvironmentError("HF_API_KEY non impostata.")
 # Definisci i percorsi dei file
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 RDF_FILE = os.path.join(BASE_DIR, "Ontologia.rdf")
         with open(documents_file, "r", encoding="utf-8") as f:
             document = json.load(f)
         logger.info(f"Documento caricato da {documents_file}.")
         # Genera embedding
         model = SentenceTransformer(embedding_model)
         # Concatenazione delle classi, proprietà e entità per l'embedding
         texts += [f"Entità: {entity['label']}. Descrizione: {entity['description']}. Proprietà: {entity['properties']}" for entity in document.get('entities', [])]
         embeddings = model.encode(texts, convert_to_numpy=True)
         logger.info("Embedding generati con SentenceTransformer.")
         # Crea l'indice FAISS
         dimension = embeddings.shape[1]
         index = faiss.IndexFlatL2(dimension)
         index.add(embeddings)
         logger.info(f"Indice FAISS creato con dimensione: {dimension}.")
         # Salva l'indice
         faiss.write_index(index, index_file)
         logger.info(f"Indice FAISS salvato in {index_file}.")
         with open(DOCUMENTS_FILE, "r", encoding="utf-8") as f:
             document = json.load(f)
         logger.info(f"Documento caricato da {DOCUMENTS_FILE}.")
         # Carica l'indice FAISS
         index = faiss.read_index(FAISS_INDEX_FILE)
         logger.info(f"Indice FAISS caricato da {FAISS_INDEX_FILE}.")
         # Genera embedding della query
         model = SentenceTransformer('all-MiniLM-L6-v2')
         query_embedding = model.encode([query], convert_to_numpy=True)
         logger.info("Embedding della query generati.")
         # Ricerca nell'indice
         distances, indices = index.search(query_embedding, top_k)
         logger.info(f"Ricerca FAISS completata. Risultati ottenuti: {len(indices[0])}")
         # Concatenazione delle descrizioni per la ricerca
         texts = [f"Classe: {cls['label']}. Descrizione: {cls['description']}" for cls in document['classes']]
         texts += [f"Proprietà: {prop['label']}. Descrizione: {prop['description']}" for prop in document['properties']]
         texts += [f"Entità: {entity['label']}. Descrizione: {entity['description']}. Proprietà: {entity['properties']}" for entity in document.get('entities', [])]
         # Recupera i testi rilevanti
         relevant_texts = [texts[idx] for idx in indices[0] if idx < len(texts)]
         retrieved_docs = "\n".join(relevant_texts)
     informazioni recuperate tramite RAG.
     """
     return f"""
+Sei un assistente museale esperto in ontologie RDF. Utilizza le informazioni fornite per generare query SPARQL precise e pertinenti. Ecco un estratto di CLASSI, PROPRIETÀ ed ENTità dell'ontologia (senza NamedIndividuals):
 --- ONTOLOGIA ---
 {ont_text}
 --- FINE ---
 """
 async def call_hf_model(prompt: str, temperature: float = 0.5, max_tokens: int = 1024) -> str:
+    """Chiama il modello Hugging Face tramite l'API REST e gestisce la risposta."""
     logger.debug("Chiamo HF con il seguente prompt:")
     content_preview = (prompt[:300] + '...') if len(prompt) > 300 else prompt
     logger.debug(f"PROMPT => {content_preview}")
+    headers = {
+        "Authorization": f"Bearer {API_KEY}"
+    }
+    payload = {
+        "inputs": prompt,
+        "parameters": {
+            "temperature": temperature,
+            "max_new_tokens": max_tokens,
+            "top_p": 0.9
+        }
+    }
     try:
+        response = requests.post(
+            f"https://api-inference.huggingface.co/models/{HF_MODEL}",
+            headers=headers,
+            json=payload
         )
+        if response.status_code != 200:
+            logger.error(f"Errore nella chiamata all'API Hugging Face: {response.status_code} - {response.text}")
+            raise HTTPException(status_code=500, detail=f"Errore nell'API Hugging Face: {response.text}")
+        data = response.json()
+        logger.debug(f"Risposta completa dal modello: {data}")
+        if isinstance(data, list) and len(data) > 0 and "generated_text" in data[0]:
+            raw = data[0]["generated_text"]
+        elif "generated_text" in data:
+            raw = data["generated_text"]
+        else:
+            raise ValueError("Nessun campo 'generated_text' nella risposta.")
         # Forza la risposta su una singola linea se multilinea
         single_line = " ".join(raw.splitlines())
         logger.debug(f"Risposta HF single-line: {single_line}")
         return single_line.strip()
     except Exception as e:
+        logger.error(f"Errore nella chiamata all'API Hugging Face tramite requests: {e}")
         raise HTTPException(status_code=500, detail=str(e))
 # Prepara i file necessari per RAG