File size: 1,404 Bytes
12e3e78
 
 
 
 
 
 
 
 
 
 
 
 
 
67b36a4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
---
title: Spark
emoji: 😻
colorFrom: purple
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: apache-2.0
short_description: ' A unified framework for reasoning and reward modeling'
---

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

## 使用说明(ZeroGPU)

- Space 类型选择 `Gradio`,硬件选择 `ZeroGPU`(需要 PRO 或企业组织)。
- 本仓库包含一个最小可用的 Spark-VL 演示:上传图片 + 输入文本,返回模型生成结果。
- 关键代码在 `app.py`  - 使用 `spaces.GPU` 装饰推理函数,调用时申请 GPU,用完后释放。
  - 首次调用按需加载 `internlm/Spark-VL-7B`,优先尝试 `flash_attention_2`,失败则回退到 `eager`  - 推理结束把模型移回 CPU,快速释放 ZeroGPU 显存。

### 本地/Space 运行

1) 推送到 Hugging Face Space 后,在 Space 设置中选择硬件 `ZeroGPU`。

2) 运行入口:`app.py`,界面包含:图片、提示词、采样参数(max_new_tokens/temperature/top_p/top_k)。

3) 可选环境变量:
   - `SPARK_MODEL_ID`:默认 `internlm/Spark-VL-7B`   - `ATTN_IMPL`:默认 `flash_attention_2`,可改为 `eager`### 依赖`requirements.txt`(Gradio 5.x,Transformers 4.45+,qwen-vl-utils 等)。ZeroGPU 的基础镜像已包含合适的 PyTorch 版本。