Spaces:

tencent
/

HunyuanVideo-Foley

Running on Zero

App Files Files Community

James Zhou commited on Aug 26

Commit

4ab7964

1 Parent(s): 9867d34

[update] app

Browse files

Files changed (3) hide show

.gitignore +155 -0
app.py +53 -9
requirements.txt +1 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,155 @@

+# Byte-compiled / optimized / DLL files
+__pycache__/
+*.py[cod]
+*$py.class
+# C extensions
+*.so
+# Distribution / packaging
+.Python
+build/
+develop-eggs/
+dist/
+downloads/
+eggs/
+.eggs/
+lib/
+lib64/
+parts/
+sdist/
+var/
+wheels/
+pip-wheel-metadata/
+share/python-wheels/
+*.egg-info/
+.installed.cfg
+*.egg
+MANIFEST
+# PyInstaller
+#  Usually these files are written by a python script from a template
+#  before PyInstaller builds the exe, so as to inject date/other infos into it.
+*.manifest
+*.spec
+# Installer logs
+pip-log.txt
+pip-delete-this-directory.txt
+# Unit test / coverage reports
+htmlcov/
+.tox/
+.nox/
+.coverage
+.coverage.*
+.cache
+nosetests.xml
+coverage.xml
+*.cover
+*.py,cover
+.hypothesis/
+.pytest_cache/
+# Translations
+*.mo
+*.pot
+# Django stuff:
+*.log
+local_settings.py
+db.sqlite3
+db.sqlite3-journal
+# Flask stuff:
+instance/
+.webassets-cache
+# Scrapy stuff:
+.scrapy
+# Sphinx documentation
+docs/_build/
+# PyBuilder
+target/
+# Jupyter Notebook
+.ipynb_checkpoints
+# IPython
+profile_default/
+ipython_config.py
+# pyenv
+.python-version
+# pipenv
+#   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
+#   However, in case of collaboration, if having platform-specific dependencies or dependencies
+#   having no cross-platform support, pipenv may install dependencies that don't work, or not
+#   install all needed dependencies.
+#Pipfile.lock
+# PEP 582; used by e.g. github.com/David-OConnor/pyflow
+__pypackages__/
+# Celery stuff
+celerybeat-schedule
+celerybeat.pid
+# SageMath parsed files
+*.sage.py
+# Environments
+.env
+.venv
+env/
+venv/
+ENV/
+env.bak/
+venv.bak/
+# Spyder project settings
+.spyderproject
+.spyproject
+# Rope project settings
+.ropeproject
+# mkdocs documentation
+/site
+# mypy
+.mypy_cache/
+.dmypy.json
+dmypy.json
+# Pyre type checker
+.pyre/
+# ==========================================
+# Custom settings
+# ==========================================
+# For MacOS
+.DS_Store
+# For IDEs
+.idea/
+.vscode/
+pyrightconfig.json
+.cursorignore
+# For global settings
+__*/
+**/my_*
+tmp*.*
+.my*
+# Model checkpoints
+*.pt
+*.ckpt
+*.pth
+*.safetensors
+CLAUDE.md

app.py CHANGED Viewed

@@ -7,6 +7,8 @@ from loguru import logger
 from typing import Optional, Tuple
 import random
 import numpy as np
 from hunyuanvideo_foley.utils.model_utils import load_model
 from hunyuanvideo_foley.utils.feature_utils import feature_process
@@ -22,6 +24,31 @@ device = None
 MODEL_PATH = os.environ.get("HIFI_FOLEY_MODEL_PATH", "./pretrained_models/")
 CONFIG_PATH = "configs/hunyuanvideo-foley-xxl.yaml"
 def setup_device(device_str: str = "auto", gpu_id: int = 0) -> torch.device:
     """Setup computing device"""
     if device_str == "auto":
@@ -48,27 +75,44 @@ def auto_load_models() -> str:
     global model_dict, cfg, device
     try:
         if not os.path.exists(MODEL_PATH):
-            return f"❌ Model file not found: {MODEL_PATH}"
         if not os.path.exists(CONFIG_PATH):
-            return f"❌ Config file not found: {CONFIG_PATH}"
         # Use GPU by default
         device = setup_device("auto", 0)
         # Load model
-        logger.info("Auto-loading model...")
-        logger.info(f"Model path: {MODEL_PATH}")
-        logger.info(f"Config path: {CONFIG_PATH}")
         model_dict, cfg = load_model(MODEL_PATH, CONFIG_PATH, device)
-        logger.info("✅ Model loaded successfully!")
-        return "✅ Model loaded successfully!"
     except Exception as e:
-        logger.error(f"Model loading failed: {str(e)}")
-        return f"❌ Model loading failed: {str(e)}"
 def infer_single_video(
     video_file,

 from typing import Optional, Tuple
 import random
 import numpy as np
+from huggingface_hub import snapshot_download
+import shutil
 from hunyuanvideo_foley.utils.model_utils import load_model
 from hunyuanvideo_foley.utils.feature_utils import feature_process
 MODEL_PATH = os.environ.get("HIFI_FOLEY_MODEL_PATH", "./pretrained_models/")
 CONFIG_PATH = "configs/hunyuanvideo-foley-xxl.yaml"
+def download_model_from_hf(repo_id: str = "tencent/HunyuanVideo-Foley", local_dir: str = "./pretrained_models") -> str:
+    """从HuggingFace自动下载模型到本地目录"""
+    try:
+        logger.info(f"开始从HuggingFace下载模型：{repo_id}")
+        logger.info(f"下载目标目录：{local_dir}")
+        # 确保本地目录存在
+        os.makedirs(local_dir, exist_ok=True)
+        # 下载整个仓库
+        snapshot_download(
+            repo_id=repo_id,
+            local_dir=local_dir,
+            resume_download=True,  # 支持断点续传
+            local_files_only=False,  # 允许从网络下载
+        )
+        logger.info(f"✅ 模型下载成功！保存在：{local_dir}")
+        return f"✅ 模型从 {repo_id} 下载成功！"
+    except Exception as e:
+        error_msg = f"❌ 模型下载失败：{str(e)}"
+        logger.error(error_msg)
+        return error_msg
 def setup_device(device_str: str = "auto", gpu_id: int = 0) -> torch.device:
     """Setup computing device"""
     if device_str == "auto":
     global model_dict, cfg, device
     try:
+        # 如果模型路径不存在，尝试从HuggingFace下载
         if not os.path.exists(MODEL_PATH):
+            logger.info(f"模型路径 {MODEL_PATH} 不存在，开始从HuggingFace下载...")
+            download_result = download_model_from_hf(local_dir=MODEL_PATH.rstrip('/'))
+            if "失败" in download_result:
+                return download_result
+        # 如果配置文件不存在，也尝试从HuggingFace下载
         if not os.path.exists(CONFIG_PATH):
+            logger.info(f"配置文件 {CONFIG_PATH} 不存在，尝试从HuggingFace下载...")
+            # 如果是从pretrained_models/配置路径，也尝试下载
+            if CONFIG_PATH.startswith("configs/"):
+                config_dir = os.path.dirname(CONFIG_PATH)
+                if not os.path.exists(config_dir):
+                    download_result = download_model_from_hf(local_dir="./")
+                    if "失败" in download_result:
+                        return download_result
+            # 最后检查配置文件是否存在
+            if not os.path.exists(CONFIG_PATH):
+                return f"❌ 配置文件未找到: {CONFIG_PATH}"
         # Use GPU by default
         device = setup_device("auto", 0)
         # Load model
+        logger.info("正在加载模型...")
+        logger.info(f"模型路径: {MODEL_PATH}")
+        logger.info(f"配置路径: {CONFIG_PATH}")
         model_dict, cfg = load_model(MODEL_PATH, CONFIG_PATH, device)
+        logger.info("✅ 模型加载成功!")
+        return "✅ 模型加载成功!"
     except Exception as e:
+        logger.error(f"模型加载失败: {str(e)}")
+        return f"❌ 模型加载失败: {str(e)}"
 def infer_single_video(
     video_file,

requirements.txt CHANGED Viewed

@@ -13,6 +13,7 @@ accelerate
 # Transformers and NLP
 git+https://github.com/huggingface/transformers@v4.49.0-SigLIP-2
 sentencepiece
 # Audio processing
 git+https://github.com/descriptinc/audiotools

 # Transformers and NLP
 git+https://github.com/huggingface/transformers@v4.49.0-SigLIP-2
 sentencepiece
+huggingface_hub
 # Audio processing
 git+https://github.com/descriptinc/audiotools