Spaces:

yuhangzang
/

spark

Running on Zero

spark / README.md

yuhangzang

update

67b36a4 12 days ago

1.4 kB

	---
	title: Spark
	emoji: 😻
	colorFrom: purple
	colorTo: pink
	sdk: gradio
	sdk_version: 5.49.1
	app_file: app.py
	pinned: false
	license: apache-2.0
	short_description: ' A unified framework for reasoning and reward modeling'
	---

	Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

	## 使用说明（ZeroGPU）

	- Space 类型选择 `Gradio`，硬件选择 `ZeroGPU`（需要 PRO 或企业组织）。
	- 本仓库包含一个最小可用的 Spark-VL 演示：上传图片 + 输入文本，返回模型生成结果。
	- 关键代码在 `app.py`：
	- 使用 `spaces.GPU` 装饰推理函数，调用时申请 GPU，用完后释放。
	- 首次调用按需加载 `internlm/Spark-VL-7B`，优先尝试 `flash_attention_2`，失败则回退到 `eager`。
	- 推理结束把模型移回 CPU，快速释放 ZeroGPU 显存。

	### 本地/Space 运行

	1) 推送到 Hugging Face Space 后，在 Space 设置中选择硬件 `ZeroGPU`。

	2) 运行入口：`app.py`，界面包含：图片、提示词、采样参数（max_new_tokens/temperature/top_p/top_k）。

	3) 可选环境变量：
	- `SPARK_MODEL_ID`：默认 `internlm/Spark-VL-7B`。
	- `ATTN_IMPL`：默认 `flash_attention_2`，可改为 `eager`。

	### 依赖

	见 `requirements.txt`（Gradio 5.x，Transformers 4.45+，qwen-vl-utils 等）。ZeroGPU 的基础镜像已包含合适的 PyTorch 版本。