Test4

Paused

App Files Files Community

euiiiia commited on 26 days ago

Commit

270fc4d

verified ·

1 Parent(s): fcecb2e

Upload 8 files

Browse files

Files changed (6) hide show

Dockerfile +79 -75
compose.yaml +31 -18
entrypoint.sh +36 -13
requirements.txt +3 -0
setup.py +114 -120
start.sh +70 -36

Dockerfile CHANGED Viewed

@@ -1,127 +1,131 @@
 # =============================================================================
-# ADUC-SDR Video Suite — High-Perf Diffusers for 8× L40S (SM 8.9)
 # CUDA 12.8 | PyTorch 2.8.0+cu128 | Ubuntu 22.04
 # =============================================================================
 FROM nvidia/cuda:12.8.0-devel-ubuntu22.04
-LABEL maintainer="Carlos Rodrigues dos Santos & Development Partner"
-LABEL description="High-performance Diffusers stack with FA2/SDPA, 8×L40S"
-LABEL version="4.4.0"
 LABEL cuda_version="12.8.0"
 LABEL python_version="3.10"
 LABEL pytorch_version="2.8.0+cu128"
 LABEL gpu_optimized_for="8x_NVIDIA_L40S"
-# ---------------- Core env & caches ----------------
 ENV DEBIAN_FRONTEND=noninteractive TZ=UTC LANG=C.UTF-8 LC_ALL=C.UTF-8 \
     PYTHONUNBUFFERED=1 PYTHONDONTWRITEBYTECODE=1 \
-    PIP_NO_CACHE_DIR=1 PIP_DISABLE_PIP_VERSION_CHECK=1
-# GPU/Compute
-ENV NVIDIA_VISIBLE_DEVICES=all
-ENV TORCH_CUDA_ARCH_LIST="8.9"
-ENV CUDA_DEVICE_ORDER=PCI_BUS_ID
-ENV CUDA_DEVICE_MAX_CONNECTIONS=32
-# Threads
 ENV OMP_NUM_THREADS=8 MKL_NUM_THREADS=8 MAX_JOBS=160
-# Alloc/caches
-ENV PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512,garbage_collection_threshold:0.8
-ENV CUDA_LAUNCH_BLOCKING=0 CUDA_CACHE_MAXSIZE=2147483648 CUDA_CACHE_DISABLE=0
-# App paths
-ENV APP_HOME=/app
-WORKDIR $APP_HOME
-# Persistent data and caches in /data
-ENV HF_HOME=/data/.cache/huggingface
-ENV TORCH_HOME=/data/.cache/torch
-ENV HF_DATASETS_CACHE=/data/.cache/datasets
-ENV TRANSFORMERS_CACHE=/data/.cache/transformers
-ENV DIFFUSERS_CACHE=/data/.cache/diffusers
-ENV HF_HUB_ENABLE_HF_TRANSFER=1
-ENV TOKENIZERS_PARALLELISM=false
-# Create non-root user and data dirs early, fix ownership
 RUN useradd -m -u 1000 -s /bin/bash appuser && \
-    mkdir -p /data /data/models \
-             /data/.cache/huggingface /data/.cache/torch \
-             /data/.cache/datasets /data/.cache/transformers /data/.cache/diffusers && \
-    chown -R appuser:appuser /data
-# Models live in /data/models and are visible at /app/models
-ENV MODELS_DIR=/data/models
-RUN ln -sf /data/models /app/models
-# ---------------- System & Python ----------------
 RUN apt-get update && apt-get install -y --no-install-recommends \
     build-essential gosu tree cmake git git-lfs curl wget ffmpeg ninja-build \
     python3.10 python3.10-dev python3.10-distutils python3-pip \
     ca-certificates libglib2.0-0 libgl1 \
  && apt-get clean && rm -rf /var/lib/apt/lists/*
-RUN ln -sf /usr/bin/python3.10 /usr/bin/python3 && \
-    ln -sf /usr/bin/python3.10 /usr/bin/python && \
     python3 -m pip install --upgrade pip
-# ---------------- PyTorch cu128 (pinned) ----------------
 RUN pip install --index-url https://download.pytorch.org/whl/cu128 \
     torch>=2.8.0+cu128 torchvision>=0.23.0+cu128 torchaudio>=2.8.0+cu128
-# ---------------- Toolchain, Triton, FA2 (no bnb build) ----------------
 RUN pip install packaging ninja cmake pybind11 scikit-build cython hf_transfer "numpy>=1.24.4"
-# Triton 3.x (no triton.ops)
 RUN pip uninstall -y triton || true && \
     pip install -v --no-build-isolation triton==3.4.0
-# FlashAttention 2.8.x
-#RUN pip install flash-attn==2.8.3 --no-build-isolation || \
-#    pip install flash-attn==2.8.2 --no-build-isolation || \
-#    pip install flash-attn==2.8.1 --no-build-isolation || \
-#    pip install flash-attn==2.8.0.post2 --no-build-isolation
---------------- App dependencies ----------------
-COPY requirements.txt ./requirements.txt
 RUN pip install --no-cache-dir -r requirements.txt
-# Pin bnb to avoid surprise CUDA/PTX mismatches (adjust as needed)
 RUN pip install --upgrade bitsandbytes
-# Custom .whl (Apex + dropout_layer_norm)
 RUN echo "Installing custom wheels..." && \
     pip install --no-cache-dir \
       "https://huggingface.co/euIaxs22/Aduc-sdr/resolve/main/apex-0.1-cp310-cp310-linux_x86_64.whl" \
       "https://huggingface.co/euIaxs22/Aduc-sdr/resolve/main/dropout_layer_norm-0.1-cp310-cp310-linux_x86_64.whl"
-# ====================================================================
-# Optional: q8_kernels + LTX-Video (enable if needed; ensure wheel ABI)
-RUN pip install --no-cache-dir \
-   "https://huggingface.co/euIaxs22/Aduc-sdr/resolve/main/q8_kernels-0.0.5-cp310-cp310-linux_x86_64.whl"
-# RUN git clone https://github.com/Lightricks/LTX-Video.git /data/LTX-Video && \
-#     cd /data/LTX-Video && python -m pip install -e .[inference]
-# ====================================================================
-# Scripts and app
-COPY info.sh ./app/info.sh
-COPY builder.sh ./app/builder.sh
-COPY start.sh ./app/start.sh
-COPY entrypoint.sh ./app/entrypoint.sh
-# Copy the rest of the source last for better caching
-COPY . .
-# Permissions on app tree
-RUN chown -R appuser:appuser /app /data && \
-    chmod 0755 /app/entrypoint.sh /app/start.sh /app/info.sh /app/builder.sh
 VOLUME /data
-ENTRYPOINT ["/app/entrypoint.sh"]
 USER appuser
-# ---------------- Entry ----------------
-CMD ["/app/start.sh"]

 # =============================================================================
+# ADUC-SDR Video Suite — Dockerfile Otimizado
+# Preserva a estrutura de instalação original para alta performance.
 # CUDA 12.8 | PyTorch 2.8.0+cu128 | Ubuntu 22.04
 # =============================================================================
 FROM nvidia/cuda:12.8.0-devel-ubuntu22.04
+LABEL maintainer="Carlos Rodrigues dos Santos"
+LABEL description="ADUC-SDR: High-performance Diffusers stack for 8x NVIDIA L40S with LTX-Video and SeedVR"
+LABEL version="5.0.0"
 LABEL cuda_version="12.8.0"
 LABEL python_version="3.10"
 LABEL pytorch_version="2.8.0+cu128"
 LABEL gpu_optimized_for="8x_NVIDIA_L40S"
+# =============================================================================
+# 1. Variáveis de Ambiente e Configuração de Paths
+# =============================================================================
 ENV DEBIAN_FRONTEND=noninteractive TZ=UTC LANG=C.UTF-8 LC_ALL=C.UTF-8 \
     PYTHONUNBUFFERED=1 PYTHONDONTWRITEBYTECODE=1 \
+    PIP_NO_CACHE_DIR=0 PIP_DISABLE_PIP_VERSION_CHECK=1
+# --- Configurações de GPU e Computação ---
+ENV NVIDIA_VISIBLE_DEVICES=all \
+    TORCH_CUDA_ARCH_LIST="8.9" \
+    CUDA_DEVICE_ORDER=PCI_BUS_ID \
+    CUDA_DEVICE_MAX_CONNECTIONS=32
+# --- Configurações de Threads ---
 ENV OMP_NUM_THREADS=8 MKL_NUM_THREADS=8 MAX_JOBS=160
+# --- Configurações de Alocador de Memória e Caches de GPU ---
+ENV PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512,garbage_collection_threshold:0.8 \
+    CUDA_LAUNCH_BLOCKING=0 CUDA_CACHE_MAXSIZE=2147483648 CUDA_CACHE_DISABLE=0
+# --- Paths da Aplicação e Dados Persistentes ---
+ENV APP_HOME=/app \
+    HF_HOME=/data/.cache/huggingface \
+    TORCH_HOME=/data/.cache/torch \
+    HF_DATASETS_CACHE=/data/.cache/datasets \
+    TRANSFORMERS_CACHE=/data/.cache/transformers \
+    DIFFUSERS_CACHE=/data/.cache/diffusers \
+    HF_HUB_ENABLE_HF_TRANSFER=1 \
+    TOKENIZERS_PARALLELISM=false
+WORKDIR $APP_HOME
+# =============================================================================
+# 2. Setup de Usuário e Sistema
+# =============================================================================
+# Cria usuário não-root e diretórios de dados/app.
+# As permissões finais serão aplicadas no final.
 RUN useradd -m -u 1000 -s /bin/bash appuser && \
+    mkdir -p /data $APP_HOME /app/output
+# --- Instalação de Pacotes de Sistema e Python ---
 RUN apt-get update && apt-get install -y --no-install-recommends \
     build-essential gosu tree cmake git git-lfs curl wget ffmpeg ninja-build \
     python3.10 python3.10-dev python3.10-distutils python3-pip \
     ca-certificates libglib2.0-0 libgl1 \
  && apt-get clean && rm -rf /var/lib/apt/lists/*
+RUN ln -sf /usr/bin/python3.10 /usr/bin/python && \
     python3 -m pip install --upgrade pip
+# =============================================================================
+# 3. Instalação da Toolchain de Machine Learning (Mantida 100% Original)
+# =============================================================================
+# --- PyTorch para CUDA 12.8 ---
 RUN pip install --index-url https://download.pytorch.org/whl/cu128 \
     torch>=2.8.0+cu128 torchvision>=0.23.0+cu128 torchaudio>=2.8.0+cu128
+# --- Ferramentas de Compilação, Triton e FlashAttention ---
 RUN pip install packaging ninja cmake pybind11 scikit-build cython hf_transfer "numpy>=1.24.4"
+# --- Triton 3.x ---
 RUN pip uninstall -y triton || true && \
     pip install -v --no-build-isolation triton==3.4.0
+# --- FlashAttention 2.8.x ---
+RUN pip install flash-attn==2.8.3 --no-build-isolation || \
+    pip install flash-attn==2.8.2 --no-build-isolation || \
+    pip install flash-attn==2.8.1 --no-build-isolation || \
+    pip install flash-attn==2.8.0.post2 --no-build-isolation
+# =============================================================================
+# 4. Instalação das Dependências da Aplicação
+# =============================================================================
+# Copia e instala requirements.txt primeiro para otimizar o cache de camadas do Docker.
+COPY --chown=appuser:appuser requirements.txt ./requirements.txt
 RUN pip install --no-cache-dir -r requirements.txt
+# --- Instalação de bitsandbytes e Wheels Customizados (Mantido 100% Original) ---
 RUN pip install --upgrade bitsandbytes
+# Instala wheels customizados (Apex, etc.)
+# Instala q8_kernels
+RUN pip install --no-cache-dir \
+   "https://huggingface.co/euIaxs22/Aduc-sdr/resolve/main/q8_kernels-0.0.5-cp310-cp310-linux_x86_64.whl"
 RUN echo "Installing custom wheels..." && \
     pip install --no-cache-dir \
       "https://huggingface.co/euIaxs22/Aduc-sdr/resolve/main/apex-0.1-cp310-cp310-linux_x86_64.whl" \
       "https://huggingface.co/euIaxs22/Aduc-sdr/resolve/main/dropout_layer_norm-0.1-cp310-cp310-linux_x86_64.whl"
+# =============================================================================
+# 5. Cópia do Código-Fonte e Configuração Final
+# =============================================================================
+# Copia o restante do código-fonte da aplicação por último.
+COPY --chown=appuser:appuser . .
+# Garante que todos os scripts de inicialização sejam executáveis
+# e que o usuário 'appuser' seja o dono de todos os arquivos.
+RUN chown -R appuser:appuser $APP_HOME /data && \
+    chmod +x /app/entrypoint.sh /app/start.sh /app/info.sh /app/builder.sh
+# =============================================================================
+# 6. Ponto de Entrada
+# =============================================================================
+# Expõe o diretório /data para ser montado como um volume persistente.
 VOLUME /data
+# Define o usuário padrão para a execução do contêiner.
 USER appuser
+# Define o script que será executado na inicialização do contêiner.
+ENTRYPOINT ["/app/entrypoint.sh"]
+# Define o comando padrão a ser executado pelo entrypoint.
+CMD ["/app/start.sh"]

compose.yaml CHANGED Viewed

@@ -1,26 +1,39 @@
 services:
-  vincie:
-    image: img2img:edit
     deploy:
       resources:
         reservations:
           devices:
-            - capabilities: [gpu]
     ports:
-      - "7860:7860"
-    environment:
-      GRADIO_SERVER_PORT: "7860"
-      HF_HUB_CACHE: "/data/.cache/huggingface/hub"
-      CKPT_ROOT: "/data/ckpt/VINCIE-3B"
-      VINCIE_ROOT: "/data/VINCIE"
     volumes:
-      - vincie_hub:/data/.cache/huggingface/hub
-      - vincie_ckpt:/data/ckpt/VINCIE-3B
-      - vincie_out:/app/outputs
-      - vincie_repo:/data/VINCIE
 volumes:
-  vincie_hub: {}
-  vincie_ckpt: {}
-  vincie_out: {}
-  vincie_repo: {}

+# compose.yaml (Versão com VINCIE)
+version: '3.8'
 services:
+  aduc-sdr-app:
+    build: .
+    environment:
+      ADUC_LOG_LEVEL: "DEBUG"
+    image: aduc-sdr-videosuite:latest
+    # (deploy, resources... mantidos como antes)
+    ports:
+      - "7860:7860" # Porta para a UI principal (LTX + SeedVR)
+      - "7861:7861" # Porta para a nova UI do VINCIE
+    volumes:
+      # O volume 'aduc_data' agora armazena tudo: cache, modelos e repos.
+      - aduc_data:/data
+      - ./output:/app/output
+    # O entrypoint cuidará do setup na inicialização.
+    # O CMD padrão iniciará a UI principal. Para VINCIE, usaremos um comando diferente.
+  # Novo serviço para a interface do VINCIE
+  vince-ui:
+    image: aduc-sdr-videosuite:latest # Usa a mesma imagem já construída
+    command: python3 /app/app_vince.py # Sobrescreve o CMD padrão para iniciar a UI do VINCIE
     deploy:
       resources:
         reservations:
           devices:
+            - driver: nvidia
+              count: all
+              capabilities: [gpu]
     ports:
+      - "7861:7861"
     volumes:
+      - aduc_data:/data
+      - ./output:/app/output
 volumes:
+  aduc_data:

entrypoint.sh CHANGED Viewed

@@ -1,21 +1,44 @@
-#!/bin/sh
-# entrypoint.sh - Executado como root para corrigir permissões.
 set -e
-echo "🔐 ENTRYPOINT (root): Corrigindo permissões para os diretórios de dados e saída..."
-# Lista de diretórios a serem criados e terem suas permissões ajustadas
-# Usamos os valores padrão, pois as variáveis de ambiente podem não estar disponíveis aqui.
-DIRS_TO_OWN="/app/outputs /app/inputs"
-# Garante que os diretórios existam
-mkdir -p $DIRS_TO_OWN
-# Muda o proprietário para o UID e GID 1000, que corresponde ao 'appuser'
-# Usar UID/GID é mais robusto em ambientes de contêiner.
-chown -R 1000:1000 $DIRS_TO_OWN
-echo "✅ ENTRYPOINT (root): Permissões corrigidas."
-# Passa a execução para o comando principal (CMD) definido no Dockerfile.
 exec "$@"

+#!/bin/bash
 set -e
+echo "🚀 ADUC-SDR Entrypoint: Configurando o ambiente de execução..."
+# --- Configuração de Performance (CPU & GPU) ---
+NUM_VCPUS=$(nproc)
+NUM_GPUS=$(nvidia-smi --query-gpu=count --format=csv,noheader | head -n 1 || echo 0)
+echo "   > Hardware: ${NUM_VCPUS} vCPUs, ${NUM_GPUS} GPUs"
+if [[ ${NUM_GPUS} -gt 0 ]]; then
+    VCPUS_PER_GPU=$((NUM_VCPUS / NUM_GPUS))
+    THREADS_PER_PROCESS=$((VCPUS_PER_GPU / 2))
+else
+    THREADS_PER_PROCESS=$((NUM_VCPUS / 2))
+fi
+MIN_THREADS=4; MAX_THREADS=16
+if [[ ${THREADS_PER_PROCESS} -lt ${MIN_THREADS} ]]; then THREADS_PER_PROCESS=${MIN_THREADS}; fi
+if [[ ${THREADS_PER_PROCESS} -gt ${MAX_THREADS} ]]; then THREADS_PER_PROCESS=${MAX_THREADS}; fi
+export OMP_NUM_THREADS=${OMP_NUM_THREADS:-${THREADS_PER_PROCESS}}
+export MKL_NUM_THREADS=${MKL_NUM_THREADS:-${THREADS_PER_PROCESS}}
+export MAX_JOBS=${MAX_JOBS:-${NUM_VCPUS}}
+export PYTORCH_CUDA_ALLOC_CONF=${PYTORCH_CUDA_ALLOC_CONF:-"max_split_size_mb:512"}
+export NVIDIA_TF32_OVERRIDE=${NVIDIA_TF32_OVERRIDE:-1}
+# --- Configuração de Depuração e Logging ---
+export ADUC_LOG_LEVEL=${ADUC_LOG_LEVEL:-"INFO"}
+export CUDA_LAUNCH_BLOCKING=${CUDA_LAUNCH_BLOCKING:-0}
+export PYTHONFAULTHANDLER=1
+export GRADIO_DEBUG=${GRADIO_DEBUG:-"False"}
+echo "   > Performance: OMP_NUM_THREADS=${OMP_NUM_THREADS}, MKL_NUM_THREADS=${MKL_NUM_THREADS}"
+echo "   > Depuração: ADUC_LOG_LEVEL=${ADUC_LOG_LEVEL}, CUDA_LAUNCH_BLOCKING=${CUDA_LAUNCH_BLOCKING}"
+echo ""
+echo ""
+#/bin/bash /app/info.sh
+# --- Setup de Dependências ---
+echo "   > Verificando dependências com setup.py..."
+python3 /app/setup.py
+echo "---------------------------------------------------------"
+echo "🔥 Ambiente configurado. Iniciando o comando principal: $@"
 exec "$@"

requirements.txt CHANGED Viewed

@@ -12,9 +12,12 @@ imageio-ffmpeg
 einops
 timm
 av
 git+https://github.com/huggingface/diffusers.git@main
 lpips>=0.1.4                    # LPIPS model for VAE training
 # Dataloading

 einops
 timm
 av
+#flash-attn-3@https://huggingface.co/alexnasa/flash-attn-3/resolve/main/128/flash_attn_3-3.0.0b1-cp39-abi3-linux_x86_64.whl
 git+https://github.com/huggingface/diffusers.git@main
+Common
+                # Configuration system.
 lpips>=0.1.4                    # LPIPS model for VAE training
 # Dataloading

setup.py CHANGED Viewed

@@ -2,179 +2,173 @@
 #
 # Copyright (C) August 4, 2025  Carlos Rodrigues dos Santos
 #
-# Versão 2.3.0 (Setup Robusto e Idempotente)
-# - Verifica a existência de repositórios e arquivos de modelo antes de baixar.
-# - Pula downloads se os artefatos já existirem, sem gerar erros.
-# - Unifica o download de todas as dependências (Git, LTX Models, SeedVR Models).
 import os
 import subprocess
 import sys
 from pathlib import Path
 import yaml
-from huggingface_hub import hf_hub_download
-# --- Configuração Geral ---
 DEPS_DIR = Path("/data")
-# --- Configuração Específica LTX-Video ---
 LTX_VIDEO_REPO_DIR = DEPS_DIR / "LTX-Video"
-# --- Configuração Específica SeedVR ---
-SEEDVR_MODELS_DIR = DEPS_DIR / "SeedVR"
-# --- Repositórios para Clonar ---
 REPOS_TO_CLONE = {
     "LTX-Video": "https://huggingface.co/spaces/Lightricks/ltx-video-distilled",
     "SeedVR": "https://github.com/numz/ComfyUI-SeedVR2_VideoUpscaler",
-    "MMAudio": "https://github.com/hkchengrex/MMAudio.git"
 }
 def run_command(command, cwd=None):
-    """Executa um comando no terminal e lida com erros."""
     print(f"Executando: {' '.join(command)}")
     try:
         subprocess.run(
-            command,
-            check=True,
-            cwd=cwd,
-            stdin=subprocess.DEVNULL,
         )
     except subprocess.CalledProcessError as e:
-        print(f"ERRO: O comando falhou com o código de saída {e.returncode}\nStderr: {e.stderr}")
         sys.exit(1)
     except FileNotFoundError:
-        print(f"ERRO: O comando '{command[0]}' não foi encontrado. Certifique-se de que o git está instalado e no seu PATH.")
         sys.exit(1)
-# --- Funções de Download (LTX-Video) ---
 def _load_ltx_config():
     """Carrega o arquivo de configuração YAML do LTX-Video."""
     print("--- Carregando Configuração do LTX-Video ---")
-    base = LTX_VIDEO_REPO_DIR / "configs"
-    candidates = [
-        base / "ltxv-13b-0.9.8-dev-fp8.yaml",
-        base / "ltxv-13b-0.9.8-distilled-fp8.yaml",
-        base / "ltxv-13b-0.9.8-distilled.yaml",
-    ]
-    for cfg_path in candidates:
-        if cfg_path.exists():
-            print(f"Configuração encontrada: {cfg_path}")
-            with open(cfg_path, "r") as file:
-                return yaml.safe_load(file)
-    fallback_path = base / "ltxv-13b-0.9.8-distilled-fp8.yaml"
-    print(f"AVISO: Nenhuma configuração preferencial encontrada. Usando fallback: {fallback_path}")
-    if not fallback_path.exists():
-        print(f"ERRO: Arquivo de configuração fallback '{fallback_path}' não encontrado.")
         return None
-    with open(fallback_path, "r") as file:
         return yaml.safe_load(file)
-def _download_ltx_models(config):
-    """Baixa os modelos principais do LTX-Video, pulando os que já existem."""
-    print("\n--- Verificando Modelos do LTX-Video ---")
-    LTX_REPO = "Lightricks/LTX-Video"
-    if "checkpoint_path" not in config or "spatial_upscaler_model_path" not in config:
-        print("ERRO: Chaves de modelo não encontradas no arquivo de configuração do LTX.")
-        sys.exit(1)
-    models_to_download = {
-        config["checkpoint_path"]: "checkpoint principal",
-        config["spatial_upscaler_model_path"]: "upscaler espacial"
-    }
-    # O hf_hub_download já verifica o cache, mas vamos verificar o diretório final para clareza
-    # e para garantir que a lógica seja explícita.
-    for filename, description in models_to_download.items():
-        # A biblioteca huggingface_hub gerencia o local exato, então confiamos nela.
-        # A verificação aqui é para garantir que o download seja tentado.
-        print(f"Garantindo a existência do {description}: {filename}...")
-        try:
-            hf_hub_download(
-                repo_id=LTX_REPO, filename=filename,
-                local_dir=os.getenv("HF_HOME"), cache_dir=os.getenv("HF_HOME_CACHE"), token=os.getenv("HF_TOKEN")
-            )
-            print(f"{description.capitalize()} está disponível.")
-        except Exception as e:
-            print(f"ERRO ao baixar o {description}: {e}")
-            sys.exit(1)
-def _download_seedvr_models():
-    """Baixa os modelos do SeedVR, pulando os que já existem."""
-    print(f"\n--- Verificando Checkpoints do SeedVR em {SEEDVR_MODELS_DIR} ---")
-    SEEDVR_MODELS_DIR.mkdir(exist_ok=True)
-    model_files = {
-        "seedvr2_ema_7b_fp16.safetensors": "MonsterMMORPG/SeedVR2_SECourses",
-        "seedvr2_ema_7b_sharp_fp16.safetensors": "MonsterMMORPG/SeedVR2_SECourses",
-        "seedvr2_ema_3b_fp16.safetensors": "MonsterMMORPG/SeedVR2_SECourses",
-        "ema_vae_fp16.safetensors": "MonsterMMORPG/SeedVR2_SECourses",
-        "pos_emb.pt": "ByteDance-Seed/SeedVR2-3B",
-        "neg_emb.pt": "ByteDance-Seed/SeedVR2-3B"
-    }
-    for filename, repo_id in model_files.items():
-        local_path = SEEDVR_MODELS_DIR / filename
-        if not local_path.is_file(): # Verifica se é um arquivo
-            print(f"Baixando {filename} de {repo_id}...")
-            try:
                 hf_hub_download(
-                    repo_id=repo_id,
-                    filename=filename,
-                    local_dir=str(SEEDVR_MODELS_DIR),
-                    cache_dir=os.getenv("HF_HOME_CACHE"),
                     token=os.getenv("HF_TOKEN"),
                 )
-                print(f"'{filename}' baixado com sucesso.")
-            except Exception as e:
-                print(f"ERRO ao baixar o modelo SeedVR '{filename}': {e}")
-                sys.exit(1)
-        else:
-            print(f"Arquivo '{filename}' já existe. Pulando.")
-    print("Checkpoints do SeedVR estão no local correto.")
-# --- Função Principal ---
 def main():
-    print("--- Iniciando Setup do Ambiente ADUC-SDR (Versão Robusta) ---")
     DEPS_DIR.mkdir(exist_ok=True)
     # --- ETAPA 1: Clonar Repositórios ---
-    print("\n--- ETAPA 1: Clonando Repositórios Git ---")
     for repo_name, repo_url in REPOS_TO_CLONE.items():
         repo_path = DEPS_DIR / repo_name
-        if repo_path.is_dir(): # Verifica se é um diretório
-            print(f"Repositório '{repo_name}' já existe. Pulando.")
         else:
             print(f"Clonando '{repo_name}' de {repo_url}...")
             run_command(["git", "clone", "--depth", "1", repo_url, str(repo_path)])
-            print(f"'{repo_name}' clonado com sucesso.")
-    # --- ETAPA 2: Baixar Modelos do LTX-Video ---
-    print("\n--- ETAPA 2: Preparando Modelos LTX-Video ---")
-    if not LTX_VIDEO_REPO_DIR.is_dir():
-        print(f"ERRO: Diretório '{LTX_VIDEO_REPO_DIR}' não encontrado. Execute a clonagem primeiro.")
-        sys.exit(1)
     ltx_config = _load_ltx_config()
-    if ltx_config:
-        _download_ltx_models(ltx_config)
-    else:
         print("ERRO: Não foi possível carregar a configuração do LTX-Video. Abortando.")
         sys.exit(1)
-    # --- ETAPA 3: Baixar Modelos do SeedVR ---
-    print("\n--- ETAPA 3: Preparando Modelos SeedVR ---")
-    _download_seedvr_models()
-    print("\n\n--- Setup do Ambiente Concluído com Sucesso! ---")
-    print("Todos os repositórios e modelos necessários foram verificados e estão prontos.")
-    print("Você agora pode iniciar a aplicação principal.")
 if __name__ == "__main__":
     main()

 #
 # Copyright (C) August 4, 2025  Carlos Rodrigues dos Santos
 #
+# Versão 3.1.0 (Setup Unificado com LTX, SeedVR e VINCIE com Cache Robusto)
+# - Orquestra a instalação de todos os repositórios e modelos para a suíte ADUC-SDR.
+# - Usa snapshot_download para baixar dependências de forma eficiente e correta.
 import os
 import subprocess
 import sys
 from pathlib import Path
 import yaml
+from huggingface_hub import hf_hub_download, snapshot_download
+# ==============================================================================
+# --- CONFIGURAÇÃO DE PATHS E CACHE ---
+# ==============================================================================
+# Assume que /data é um volume persistente montado no contêiner.
 DEPS_DIR = Path("/data")
+CACHE_DIR = DEPS_DIR / ".cache" / "huggingface"
+# --- Paths dos Módulos da Aplicação ---
 LTX_VIDEO_REPO_DIR = DEPS_DIR / "LTX-Video"
+SEEDVR_MODELS_DIR = DEPS_DIR / "models" / "SeedVR"
+VINCIE_REPO_DIR = DEPS_DIR / "VINCIE"
+VINCIE_CKPT_DIR = DEPS_DIR / "ckpt" / "VINCIE-3B"
+# --- Repositórios Git para Clonar ---
 REPOS_TO_CLONE = {
     "LTX-Video": "https://huggingface.co/spaces/Lightricks/ltx-video-distilled",
     "SeedVR": "https://github.com/numz/ComfyUI-SeedVR2_VideoUpscaler",
+    "VINCIE": "https://github.com/ByteDance-Seed/VINCIE",
 }
+# ==============================================================================
+# --- FUNÇÕES AUXILIARES ---
+# ==============================================================================
 def run_command(command, cwd=None):
+    """Executa um comando no terminal de forma segura e com logs claros."""
     print(f"Executando: {' '.join(command)}")
     try:
         subprocess.run(
+            command, check=True, cwd=cwd,
+            stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True,
         )
     except subprocess.CalledProcessError as e:
+        print(f"ERRO: O comando falhou com o código {e.returncode}\nStderr:\n{e.stderr.strip()}")
         sys.exit(1)
     except FileNotFoundError:
+        print(f"ERRO: Comando '{command[0]}' não encontrado. Verifique se o git está instalado.")
         sys.exit(1)
 def _load_ltx_config():
     """Carrega o arquivo de configuração YAML do LTX-Video."""
     print("--- Carregando Configuração do LTX-Video ---")
+    config_file = LTX_VIDEO_REPO_DIR / "configs" / "ltxv-13b-0.9.8-distilled-fp8.yaml"
+    if not config_file.exists():
+        print(f"ERRO: Arquivo de configuração do LTX não encontrado em '{config_file}'")
         return None
+    print(f"Configuração LTX encontrada: {config_file}")
+    with open(config_file, "r") as file:
         return yaml.safe_load(file)
+def _ensure_hf_model(repo_id, filenames=None, allow_patterns=None, local_dir=None):
+    """Função genérica para baixar um ou mais arquivos (hf_hub_download) ou um snapshot (snapshot_download)."""
+    if not repo_id: return
+    print(f"Verificando/Baixando modelo do repositório: '{repo_id}'...")
+    try:
+        if filenames: # Baixa arquivos específicos
+            for filename in filenames:
+                if not filename: continue
                 hf_hub_download(
+                    repo_id=repo_id, filename=filename, cache_dir=str(CACHE_DIR),
+                    local_dir=str(local_dir) if local_dir else None,
+                    #local_dir_use_symlinks=False,
                     token=os.getenv("HF_TOKEN"),
                 )
+        else: # Baixa um snapshot (partes de um repositório)
+            snapshot_download(
+                repo_id=repo_id, cache_dir=str(CACHE_DIR),
+                local_dir=str(local_dir) if local_dir else None,
+                allow_patterns=allow_patterns,
+                token=os.getenv("HF_TOKEN"),
+            )
+        print(f"-> Modelo '{repo_id}' está disponível.")
+    except Exception as e:
+        print(f"ERRO CRÍTICO ao baixar o modelo '{repo_id}': {e}")
+        sys.exit(1)
+# ==============================================================================
+# --- FUNÇÃO PRINCIPAL DE SETUP ---
+# ==============================================================================
 def main():
+    """Orquestra todo o processo de setup do ambiente."""
+    print("--- Iniciando Setup do Ambiente ADUC-SDR (LTX + SeedVR + VINCIE) ---")
     DEPS_DIR.mkdir(exist_ok=True)
+    CACHE_DIR.mkdir(parents=True, exist_ok=True)
     # --- ETAPA 1: Clonar Repositórios ---
+    print("\n--- ETAPA 1: Verificando Repositórios Git ---")
     for repo_name, repo_url in REPOS_TO_CLONE.items():
         repo_path = DEPS_DIR / repo_name
+        if repo_path.is_dir():
+            print(f"Repositório '{repo_name}' já existe em '{repo_path}'. Pulando.")
         else:
             print(f"Clonando '{repo_name}' de {repo_url}...")
             run_command(["git", "clone", "--depth", "1", repo_url, str(repo_path)])
+            print(f"-> '{repo_name}' clonado com sucesso.")
+    # --- ETAPA 2: Baixar Modelos LTX-Video e Dependências ---
+    print("\n--- ETAPA 2: Verificando Modelos LTX-Video e Dependências ---")
     ltx_config = _load_ltx_config()
+    if not ltx_config:
         print("ERRO: Não foi possível carregar a configuração do LTX-Video. Abortando.")
         sys.exit(1)
+    _ensure_hf_model(
+        repo_id="Lightricks/LTX-Video",
+        filenames=[
+            ltx_config.get("checkpoint_path"),
+            ltx_config.get("spatial_upscaler_model_path") # <-- Adicione esta linha
+        ]
+    )
+    _ensure_hf_model(
+        repo_id=ltx_config.get("text_encoder_model_name_or_path"),
+        allow_patterns=["*.json", "*.safetensors"]
+    )
+    enhancer_repos = [
+        ltx_config.get("prompt_enhancer_image_caption_model_name_or_path"),
+        ltx_config.get("prompt_enhancer_llm_model_name_or_path"),
+    ]
+    for repo_id in filter(None, enhancer_repos):
+         _ensure_hf_model(repo_id=repo_id, allow_patterns=["*.json", "*.safetensors", "*.bin"])
+    # --- ETAPA 3: Baixar Modelos SeedVR ---
+    print("\n--- ETAPA 3: Verificando Modelos SeedVR ---")
+    SEEDVR_MODELS_DIR.mkdir(parents=True, exist_ok=True)
+    seedvr_files = {
+        "seedvr2_ema_7b_fp16.safetensors": "MonsterMMORPG/SeedVR2_SECourses",
+        "seedvr2_ema_7b_sharp_fp16.safetensors": "MonsterMMORPG/SeedVR2_SECourses",
+        "ema_vae_fp16.safetensors": "MonsterMMORPG/SeedVR2_SECourses",
+    }
+    for filename, repo_id in seedvr_files.items():
+        if not (SEEDVR_MODELS_DIR / filename).is_file():
+             _ensure_hf_model(repo_id=repo_id, filenames=[filename], local_dir=SEEDVR_MODELS_DIR)
+        else:
+            print(f"Arquivo SeedVR '{filename}' já existe. Pulando.")
+    # --- ETAPA 4: Baixar Modelos VINCIE ---
+    print("\n--- ETAPA 4: Verificando Modelos VINCIE ---")
+    VINCIE_CKPT_DIR.mkdir(parents=True, exist_ok=True)
+    _ensure_hf_model(repo_id="ByteDance-Seed/VINCIE-3B", local_dir=VINCIE_CKPT_DIR)
+    # Cria o symlink de compatibilidade, se necessário
+    repo_ckpt_dir = VINCIE_REPO_DIR / "ckpt"
+    repo_ckpt_dir.mkdir(parents=True, exist_ok=True)
+    link = repo_ckpt_dir / "VINCIE-3B"
+    if not link.exists():
+        link.symlink_to(VINCIE_CKPT_DIR.resolve(), target_is_directory=True)
+        print(f"-> Symlink de compatibilidade VINCIE criado: '{link}' -> '{VINCIE_CKPT_DIR.resolve()}'")
+    else:
+        print(f"-> Symlink de compatibilidade VINCIE já existe.")
+    print("\n\n--- ✅ Setup Completo do Ambiente ADUC-SDR Concluído com Sucesso! ---")
+    print("Todos os repositórios e modelos foram verificados e estão prontos para uso.")
 if __name__ == "__main__":
     main()

start.sh CHANGED Viewed

@@ -1,49 +1,83 @@
-#!/usr/bin/env bash
-set -euo pipefail
-tree -L 4 /app
-tree -L 4 /data
-echo "🚀 Iniciando o script de setup e lançamento do LTX-Video..."
-echo "Usuário atual: $(whoami)"
-# Define as variáveis de ambiente que o LTXServer irá consumir
-export HF_HOME="${HF_HOME:-/data/.cache/huggingface}"
-export OUTPUT_ROOT="${OUTPUT_ROOT:-/app/outputs/ltx}"
-export LTXV_FRAME_LOG_EVERY=8
-export LTXV_DEBUG=1
-# --- Garante que Diretórios Existam ---
-mkdir -p "$OUTPUT_ROOT" "$HF_HOME"
-# 1) Builder (garante Apex/Flash e deps CUDA)
-#echo "🛠️  Iniciando o builder.sh para compilar/instalar dependências CUDA..."
-#if [ -f "/app/builder.sh" ]; then
-#  /bin/bash /app/builder.sh
-#  echo "✅ Builder finalizado."
-#else
-#  echo "⚠️  Aviso: builder.sh não encontrado. Pulando etapa de compilação de dependências."
-#fi
-python setup.py
-cp -rfv /app/LTX-Video/ /data/
-export OUTPUT_ROOT="${OUTPUT_ROOT:-/app/outputs}"
-export INPUT_ROOT="${INPUT_ROOT:-/app/inputs}"
-mkdir -p "$OUTPUT_ROOT" "$INPUT_ROOT"
-echo "[aduc][start] Verificando ambiente como usuário: $(whoami)"
-# Env da UI
-export GRADIO_SERVER_NAME="0.0.0.0"
-export GRADIO_SERVER_PORT="${PORT:-7860}"
-export GRADIO_ENABLE_QUEUE="True"
-echo "[ltx][start] Lançando app_ltx.py..."
-# Executa diretamente o python.
-exec python app.py

+#!/bin/bash
+# ==============================================================================
+# GERENCIAMENTO DE LOGS NA INICIALIZAÇÃO
+# ==============================================================================
+mkdir /data/logs
+LOG_FILE="/data/logs/session.log"
+# Verifica se o arquivo de log da sessão anterior existe e não está vazio
+if [ -f "$LOG_FILE" ] && [ -s "$LOG_FILE" ]; then
+    echo "[STARTUP] Log da sessão anterior encontrado. Preparando para upload."
+    # Cria um nome de arquivo com timestamp para o upload
+    TODAY=$(date +%Y-%m-%d)
+    TIMESTAMP=$(date +%H-%M-%S)
+    UPLOAD_FILENAME="log-${TIMESTAMP}.txt"
+    export REPO_PATH="logs/${TODAY}/${UPLOAD_FILENAME}"
+    # Move o log antigo para um local temporário para evitar que a aplicação comece a escrever nele
+    TEMP_LOG_PATH="/data/previous_session.log"
+    mv "$LOG_FILE" "$TEMP_LOG_PATH"
+    echo "[STARTUP] Fazendo upload de '$TEMP_LOG_PATH' para o repositório em '$REPO_PATH'..."
+    # Executa o script de upload do Python em segundo plano para não bloquear a inicialização
+    # O token HF_TOKEN deve estar definido como uma variável de ambiente no seu contêiner
+    python - <<'PY' &
+import os
+import time
+from huggingface_hub import HfApi, HfFolder
+# Adiciona uma pequena espera para garantir que a rede esteja pronta
+time.sleep(5)
+repo = os.environ.get("SELF_HF_REPO_ID", "eeuuia/Tmp")
+token = os.getenv("HF_TOKEN")
+log_to_upload = "/data/previous_session.log"
+repo_path = os.getenv("REPO_PATH",'logs/log.log')
+if not token:
+    print("[UPLOAD_SCRIPT] AVISO: HF_TOKEN ausente; upload do log desabilitado.")
+    # Limpa o arquivo temporário mesmo assim
+    if os.path.exists(log_to_upload):
+        os.remove(log_to_upload)
+    exit()
+if not repo_path:
+    print("[UPLOAD_SCRIPT] ERRO: REPO_PATH não definido.")
+    exit()
+try:
+    print(f"[UPLOAD_SCRIPT] Iniciando upload para {repo}...")
+    api = HfApi(token=token)
+    api.upload_file(
+        path_or_fileobj=log_to_upload,
+        path_in_repo=repo_path,
+        repo_id=repo,
+        repo_type="model",
+    )
+    print(f"[UPLOAD_SCRIPT] Upload de log concluído com sucesso para: {repo_path}")
+finally:
+    # Garante que o arquivo de log temporário seja sempre removido após a tentativa de upload
+    if os.path.exists(log_to_upload):
+        os.remove(log_to_upload)
+        print("[UPLOAD_SCRIPT] Arquivo de log temporário limpo.")
+PY
+else
+    echo "[STARTUP] Nenhum log da sessão anterior encontrado. Iniciando com um log limpo."
+fi
+# ==============================================================================
+# INICIALIZAÇÃO DA APLICAÇÃO PRINCIPAL
+# ==============================================================================
+echo "[STARTUP] Iniciando a aplicação principal Gradio (app.py)..."
+# Executa o setup.py primeiro para garantir que as dependências estão prontas
+python /app/setup.py
+# Inicia a aplicação Gradio
+# O `exec` substitui o processo do shell pelo processo do python,
+# o que é uma boa prática para scripts de inicialização de contêineres.
+exec python /app/app.py