Spaces:

yuhangzang
/

spark

Running on Zero

File size: 1,404 Bytes

---
title: Spark
emoji: 😻
colorFrom: purple
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: apache-2.0
short_description: ' A unified framework for reasoning and reward modeling'
---

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

## 使用说明（ZeroGPU）

- Space 类型选择 `Gradio`，硬件选择 `ZeroGPU`（需要 PRO 或企业组织）。
- 本仓库包含一个最小可用的 Spark-VL 演示：上传图片 + 输入文本，返回模型生成结果。
- 关键代码在 `app.py`：
  - 使用 `spaces.GPU` 装饰推理函数，调用时申请 GPU，用完后释放。
  - 首次调用按需加载 `internlm/Spark-VL-7B`，优先尝试 `flash_attention_2`，失败则回退到 `eager`。
  - 推理结束把模型移回 CPU，快速释放 ZeroGPU 显存。

### 本地/Space 运行

1) 推送到 Hugging Face Space 后，在 Space 设置中选择硬件 `ZeroGPU`。

2) 运行入口：`app.py`，界面包含：图片、提示词、采样参数（max_new_tokens/temperature/top_p/top_k）。

3) 可选环境变量：
   - `SPARK_MODEL_ID`：默认 `internlm/Spark-VL-7B`。
   - `ATTN_IMPL`：默认 `flash_attention_2`，可改为 `eager`。

### 依赖

见 `requirements.txt`（Gradio 5.x，Transformers 4.45+，qwen-vl-utils 等）。ZeroGPU 的基础镜像已包含合适的 PyTorch 版本。