Aduc_sdr

Paused

App Files Files Community

euiia commited on Sep 2

Commit

3b91b34

verified ·

1 Parent(s): 7ac3581

Update deformes4D_engine.py

Browse files

Files changed (1) hide show

deformes4D_engine.py +22 -12

deformes4D_engine.py CHANGED Viewed

@@ -292,29 +292,39 @@ class Deformes4DEngine:
         return refined_latents_tensor
     def refine_latents(self, latents: torch.Tensor,
                        fps: int = 24,
                        denoise_strength: float = 0.35,
                        refine_steps: int = 12,
                        motion_prompt: str = "refining video, improving details, cinematic quality") -> torch.Tensor:
-        """Aplica um passe de refinamento (denoise) em um tensor latente."""
-        logger.info(f"Refinando tensor latente com shape {latents.shape}.")
         _, _, num_latent_frames, latent_h, latent_w = latents.shape
-        # Assume que o fator de escala temporal é o mesmo que o espacial.
-        # Se for diferente, você precisará buscá-lo especificamente.
-        # video_scale_factor = self.vae.config.temporal_scale_factor
-        vae_scale_factor = self.vae.config.scaling_factor if hasattr(self.vae.config, 'scaling_factor') else 8
         pixel_height = latent_h * vae_scale_factor
         pixel_width = latent_w * vae_scale_factor
-        # --- [INÍCIO DA CORREÇÃO] ---
-        # Converte o número de frames latentes para frames de pixel.
-        pixel_frames = num_latent_frames * vae_scale_factor
-        # --- [FIM DA CORREÇÃO] ---
-        # Agora, todos os parâmetros estão na escala de pixels, como a pipeline espera.
         refined_latents_tensor, _ = self.ltx_manager.refine_latents(
             latents,
             height=pixel_height,
@@ -329,7 +339,7 @@ class Deformes4DEngine:
         logger.info(f"Retornando tensor latente refinado com shape: {refined_latents_tensor.shape}")
         return refined_latents_tensor
     def upscale_latents(self, latents: torch.Tensor) -> torch.Tensor:

         return refined_latents_tensor
     def refine_latents(self, latents: torch.Tensor,
                        fps: int = 24,
                        denoise_strength: float = 0.35,
                        refine_steps: int = 12,
                        motion_prompt: str = "refining video, improving details, cinematic quality") -> torch.Tensor:
+        """
+        Aplica um passe de refinamento (denoise) em um tensor latente.
+        [CORRIGIDO] Calcula os frames de pixel de forma a alinhar com a lógica do VAE causal.
+        """
+        logger.info(f"Refinando tensor latente com shape {latents.shape} para refinamento.")
+        # Extrai as dimensões do tensor latente de ENTRADA.
         _, _, num_latent_frames, latent_h, latent_w = latents.shape
+        # Busca os fatores de escala do VAE. Assumimos que o fator temporal e espacial são iguais.
+        # Esta é uma suposição segura para o LTX-Video.
+        video_scale_factor = getattr(self.vae, 'temporal_downscale_factor', 8)
+        vae_scale_factor = getattr(self.vae, 'spatial_downscale_factor', 8)
+        # Converte as dimensões latentes para as dimensões de pixel correspondentes.
         pixel_height = latent_h * vae_scale_factor
         pixel_width = latent_w * vae_scale_factor
+        # --- [A CORREÇÃO PRINCIPAL ESTÁ AQUI] ---
+        # Para que a pipeline espere um latente com 'num_latent_frames', precisamos
+        # fornecer um número de frames de pixel que, após a divisão e a adição de 1
+        # (devido ao VAE causal), resulte no número original de frames latentes.
+        # A fórmula inversa é: (num_latent_frames - 1) * video_scale_factor
+        pixel_frames = (num_latent_frames - 1) * video_scale_factor
+        # Chama o ltx_manager com os parâmetros corretos.
         refined_latents_tensor, _ = self.ltx_manager.refine_latents(
             latents,
             height=pixel_height,
         logger.info(f"Retornando tensor latente refinado com shape: {refined_latents_tensor.shape}")
         return refined_latents_tensor
     def upscale_latents(self, latents: torch.Tensor) -> torch.Tensor: