spark / README.md
yuhangzang
update
67b36a4
metadata
title: Spark
emoji: 😻
colorFrom: purple
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: apache-2.0
short_description: ' A unified framework for reasoning and reward modeling'

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

使用说明(ZeroGPU)

  • Space 类型选择 Gradio,硬件选择 ZeroGPU(需要 PRO 或企业组织)。
  • 本仓库包含一个最小可用的 Spark-VL 演示:上传图片 + 输入文本,返回模型生成结果。
  • 关键代码在 app.py
    • 使用 spaces.GPU 装饰推理函数,调用时申请 GPU,用完后释放。
    • 首次调用按需加载 internlm/Spark-VL-7B,优先尝试 flash_attention_2,失败则回退到 eager
    • 推理结束把模型移回 CPU,快速释放 ZeroGPU 显存。

本地/Space 运行

  1. 推送到 Hugging Face Space 后,在 Space 设置中选择硬件 ZeroGPU

  2. 运行入口:app.py,界面包含:图片、提示词、采样参数(max_new_tokens/temperature/top_p/top_k)。

  3. 可选环境变量:

    • SPARK_MODEL_ID:默认 internlm/Spark-VL-7B
    • ATTN_IMPL:默认 flash_attention_2,可改为 eager

依赖

requirements.txt(Gradio 5.x,Transformers 4.45+,qwen-vl-utils 等)。ZeroGPU 的基础镜像已包含合适的 PyTorch 版本。