Spaces:
Running
on
Zero
Running
on
Zero
File size: 1,404 Bytes
12e3e78 67b36a4 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 |
---
title: Spark
emoji: 😻
colorFrom: purple
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: apache-2.0
short_description: ' A unified framework for reasoning and reward modeling'
---
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
## 使用说明(ZeroGPU)
- Space 类型选择 `Gradio`,硬件选择 `ZeroGPU`(需要 PRO 或企业组织)。
- 本仓库包含一个最小可用的 Spark-VL 演示:上传图片 + 输入文本,返回模型生成结果。
- 关键代码在 `app.py`:
- 使用 `spaces.GPU` 装饰推理函数,调用时申请 GPU,用完后释放。
- 首次调用按需加载 `internlm/Spark-VL-7B`,优先尝试 `flash_attention_2`,失败则回退到 `eager`。
- 推理结束把模型移回 CPU,快速释放 ZeroGPU 显存。
### 本地/Space 运行
1) 推送到 Hugging Face Space 后,在 Space 设置中选择硬件 `ZeroGPU`。
2) 运行入口:`app.py`,界面包含:图片、提示词、采样参数(max_new_tokens/temperature/top_p/top_k)。
3) 可选环境变量:
- `SPARK_MODEL_ID`:默认 `internlm/Spark-VL-7B`。
- `ATTN_IMPL`:默认 `flash_attention_2`,可改为 `eager`。
### 依赖
见 `requirements.txt`(Gradio 5.x,Transformers 4.45+,qwen-vl-utils 等)。ZeroGPU 的基础镜像已包含合适的 PyTorch 版本。
|