Spaces:
				
			
			
	
			
			
		Running
		
			on 
			
			Zero
	
	
	
			
			
	
	
	
	
		
		
		Running
		
			on 
			
			Zero
	metadata
			title: Spark
emoji: 😻
colorFrom: purple
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: apache-2.0
short_description: ' A unified framework for reasoning and reward modeling'
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
使用说明(ZeroGPU)
- Space 类型选择 Gradio,硬件选择ZeroGPU(需要 PRO 或企业组织)。
- 本仓库包含一个最小可用的 Spark-VL 演示:上传图片 + 输入文本,返回模型生成结果。
- 关键代码在 app.py:- 使用 spaces.GPU装饰推理函数,调用时申请 GPU,用完后释放。
- 首次调用按需加载 internlm/Spark-VL-7B,优先尝试flash_attention_2,失败则回退到eager。
- 推理结束把模型移回 CPU,快速释放 ZeroGPU 显存。
 
- 使用 
本地/Space 运行
- 推送到 Hugging Face Space 后,在 Space 设置中选择硬件 - ZeroGPU。
- 运行入口: - app.py,界面包含:图片、提示词、采样参数(max_new_tokens/temperature/top_p/top_k)。
- 可选环境变量: - SPARK_MODEL_ID:默认- internlm/Spark-VL-7B。
- ATTN_IMPL:默认- flash_attention_2,可改为- eager。
 
依赖
见 requirements.txt(Gradio 5.x,Transformers 4.45+,qwen-vl-utils 等)。ZeroGPU 的基础镜像已包含合适的 PyTorch 版本。