cognitive_mapping_probe_3

Sleeping

App Files Files Community

neuralworm commited on 26 days ago

Commit

2169e97

1 Parent(s): 2161eb0

get layers from model

Browse files

Files changed (1) hide show

cognitive_mapping_probe/llm_iface.py +19 -12

cognitive_mapping_probe/llm_iface.py CHANGED Viewed

@@ -59,37 +59,44 @@ class LLM:
     def _populate_stable_config(self) -> StableLLMConfig:
         """
         Liest die volatile `transformers`-Konfiguration aus und befüllt unsere stabile Datenklasse.
-        Implementiert eine robuste, zweistufige Fallback-Strategie.
         """
         # --- Robuste Methode für hidden_dim ---
         try:
             hidden_dim = self.model.get_input_embeddings().weight.shape[1]
         except AttributeError:
             hidden_dim = getattr(self.config, 'hidden_size', getattr(self.config, 'd_model', 0))
-        # --- KORREKTUR: Robuste Methode für num_layers ---
         num_layers = 0
         try:
-            # METHODE 1 (BESTE): Direkte Inspektion der Architektur des geladenen Modells.
-            # Dies ist die Ground Truth.
-            if hasattr(self.model, 'model') and hasattr(self.model.model, 'layers'):
                  num_layers = len(self.model.model.layers)
-            # Fallback für Architekturen, die die Layer anders benennen (z.B. model.transformer.h)
             elif hasattr(self.model, 'transformer') and hasattr(self.model.transformer, 'h'):
                  num_layers = len(self.model.transformer.h)
         except (AttributeError, TypeError):
-            # Wenn die direkte Inspektion fehlschlägt, was unwahrscheinlich ist,
-            # fahre mit der alten Methode fort.
             pass
         if num_layers == 0:
             # METHODE 2 (FALLBACK): Inspektion der deklarativen Config-Datei.
-            # Dies ist weniger robust, aber ein guter zweiter Versuch.
             num_layers = getattr(self.config, 'num_hidden_layers', getattr(self.config, 'num_layers', 0))
-        # Finale Assertions zur Sicherstellung der wissenschaftlichen Validität
-        assert hidden_dim > 0, "Could not determine hidden dimension from model config."
-        assert num_layers > 0, "Could not determine number of layers from model config."
         dbg(f"Populated stable config: hidden_dim={hidden_dim}, num_layers={num_layers}")
         return StableLLMConfig(hidden_dim=hidden_dim, num_layers=num_layers)

     def _populate_stable_config(self) -> StableLLMConfig:
         """
         Liest die volatile `transformers`-Konfiguration aus und befüllt unsere stabile Datenklasse.
+        Implementiert eine robuste, mehrstufige Fallback-Strategie und eine auto-diagnostische Fehlerbehandlung.
         """
         # --- Robuste Methode für hidden_dim ---
+        hidden_dim = 0
         try:
             hidden_dim = self.model.get_input_embeddings().weight.shape[1]
         except AttributeError:
             hidden_dim = getattr(self.config, 'hidden_size', getattr(self.config, 'd_model', 0))
+        # --- Robuste Methode für num_layers ---
         num_layers = 0
         try:
+            # METHODE 1 (BESTE): Direkte Inspektion der Architektur basierend auf empirischer Evidenz.
+            if hasattr(self.model, 'model') and hasattr(self.model.model, 'language_model') and hasattr(self.model.model.language_model, 'layers'):
+                 num_layers = len(self.model.model.language_model.layers)
+            elif hasattr(self.model, 'model') and hasattr(self.model.model, 'layers'):
                  num_layers = len(self.model.model.layers)
             elif hasattr(self.model, 'transformer') and hasattr(self.model.transformer, 'h'):
                  num_layers = len(self.model.transformer.h)
         except (AttributeError, TypeError):
             pass
         if num_layers == 0:
             # METHODE 2 (FALLBACK): Inspektion der deklarativen Config-Datei.
             num_layers = getattr(self.config, 'num_hidden_layers', getattr(self.config, 'num_layers', 0))
+        # --- NEU: Automatisierte diagnostische Ausgabe bei Fehlschlag ---
+        if hidden_dim <= 0 or num_layers <= 0:
+            dbg("--- CRITICAL: Failed to auto-determine model configuration. ---")
+            dbg(f"Detected hidden_dim: {hidden_dim}, num_layers: {num_layers}")
+            dbg("--- DUMPING MODEL ARCHITECTURE FOR DEBUGGING: ---")
+            dbg(self.model)
+            dbg("--- END ARCHITECTURE DUMP ---")
+        # Finale Assertions zur Sicherstellung der wissenschaftlichen Validität.
+        # Diese werden nun eine informative Debug-Ausgabe vor dem Absturz haben.
+        assert hidden_dim > 0, "Could not determine hidden dimension from model config. Check debug dump above."
+        assert num_layers > 0, "Could not determine number of layers from model config. Check debug dump above."
         dbg(f"Populated stable config: hidden_dim={hidden_dim}, num_layers={num_layers}")
         return StableLLMConfig(hidden_dim=hidden_dim, num_layers=num_layers)