cognitive_mapping_probe_4

Sleeping

App Files Files Community

neuralworm commited on Nov 5

Commit

2161eb0

1 Parent(s): a285b10

get layers from model

Browse files

Files changed (1) hide show

cognitive_mapping_probe/llm_iface.py +25 -7

cognitive_mapping_probe/llm_iface.py CHANGED Viewed

@@ -49,9 +49,9 @@ class LLM:
             print(f"[WARN] Could not set 'eager' attention: {e}.", flush=True)
         self.model.eval()
-        self.config = self.model.config # Behalte den Zugriff auf die Originalkonfiguration
-        # --- NEU: Befülle die stabile Konfigurations-Abstraktion ---
         self.stable_config = self._populate_stable_config()
         print(f"[INFO] Model '{model_id}' loaded on device: {self.model.device}", flush=True)
@@ -59,17 +59,35 @@ class LLM:
     def _populate_stable_config(self) -> StableLLMConfig:
         """
         Liest die volatile `transformers`-Konfiguration aus und befüllt unsere stabile Datenklasse.
         """
-        # Robuste Methode für hidden_dim
         try:
             hidden_dim = self.model.get_input_embeddings().weight.shape[1]
         except AttributeError:
             hidden_dim = getattr(self.config, 'hidden_size', getattr(self.config, 'd_model', 0))
-        # Robuste Methode für num_layers
-        num_layers = getattr(self.config, 'num_hidden_layers', getattr(self.config, 'num_layers', 0))
-        # Assertions zur Sicherstellung der wissenschaftlichen Validität
         assert hidden_dim > 0, "Could not determine hidden dimension from model config."
         assert num_layers > 0, "Could not determine number of layers from model config."

             print(f"[WARN] Could not set 'eager' attention: {e}.", flush=True)
         self.model.eval()
+        self.config = self.model.config
+        # Befülle die stabile Konfigurations-Abstraktion
         self.stable_config = self._populate_stable_config()
         print(f"[INFO] Model '{model_id}' loaded on device: {self.model.device}", flush=True)
     def _populate_stable_config(self) -> StableLLMConfig:
         """
         Liest die volatile `transformers`-Konfiguration aus und befüllt unsere stabile Datenklasse.
+        Implementiert eine robuste, zweistufige Fallback-Strategie.
         """
+        # --- Robuste Methode für hidden_dim ---
         try:
             hidden_dim = self.model.get_input_embeddings().weight.shape[1]
         except AttributeError:
             hidden_dim = getattr(self.config, 'hidden_size', getattr(self.config, 'd_model', 0))
+        # --- KORREKTUR: Robuste Methode für num_layers ---
+        num_layers = 0
+        try:
+            # METHODE 1 (BESTE): Direkte Inspektion der Architektur des geladenen Modells.
+            # Dies ist die Ground Truth.
+            if hasattr(self.model, 'model') and hasattr(self.model.model, 'layers'):
+                 num_layers = len(self.model.model.layers)
+            # Fallback für Architekturen, die die Layer anders benennen (z.B. model.transformer.h)
+            elif hasattr(self.model, 'transformer') and hasattr(self.model.transformer, 'h'):
+                 num_layers = len(self.model.transformer.h)
+        except (AttributeError, TypeError):
+            # Wenn die direkte Inspektion fehlschlägt, was unwahrscheinlich ist,
+            # fahre mit der alten Methode fort.
+            pass
+        if num_layers == 0:
+            # METHODE 2 (FALLBACK): Inspektion der deklarativen Config-Datei.
+            # Dies ist weniger robust, aber ein guter zweiter Versuch.
+            num_layers = getattr(self.config, 'num_hidden_layers', getattr(self.config, 'num_layers', 0))
+        # Finale Assertions zur Sicherstellung der wissenschaftlichen Validität
         assert hidden_dim > 0, "Could not determine hidden dimension from model config."
         assert num_layers > 0, "Could not determine number of layers from model config."