Spaces:
				
			
			
	
			
			
		Running
		
			on 
			
			Zero
	
	
	
			
			
	
	
	
	
		
		
		Running
		
			on 
			
			Zero
	| title: Spark | |
| emoji: 😻 | |
| colorFrom: purple | |
| colorTo: pink | |
| sdk: gradio | |
| sdk_version: 5.49.1 | |
| app_file: app.py | |
| pinned: false | |
| license: apache-2.0 | |
| short_description: ' A unified framework for reasoning and reward modeling' | |
| Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference | |
| ## 使用说明(ZeroGPU) | |
| - Space 类型选择 `Gradio`,硬件选择 `ZeroGPU`(需要 PRO 或企业组织)。 | |
| - 本仓库包含一个最小可用的 Spark-VL 演示:上传图片 + 输入文本,返回模型生成结果。 | |
| - 关键代码在 `app.py`: | |
| - 使用 `spaces.GPU` 装饰推理函数,调用时申请 GPU,用完后释放。 | |
| - 首次调用按需加载 `internlm/Spark-VL-7B`,优先尝试 `flash_attention_2`,失败则回退到 `eager`。 | |
| - 推理结束把模型移回 CPU,快速释放 ZeroGPU 显存。 | |
| ### 本地/Space 运行 | |
| 1) 推送到 Hugging Face Space 后,在 Space 设置中选择硬件 `ZeroGPU`。 | |
| 2) 运行入口:`app.py`,界面包含:图片、提示词、采样参数(max_new_tokens/temperature/top_p/top_k)。 | |
| 3) 可选环境变量: | |
| - `SPARK_MODEL_ID`:默认 `internlm/Spark-VL-7B`。 | |
| - `ATTN_IMPL`:默认 `flash_attention_2`,可改为 `eager`。 | |
| ### 依赖 | |
| 见 `requirements.txt`(Gradio 5.x,Transformers 4.45+,qwen-vl-utils 等)。ZeroGPU 的基础镜像已包含合适的 PyTorch 版本。 | |