giladgd
/

Qwen3-Reranker-0.6B-GGUF

Model card Files Files and versions

giladgd commited on Sep 27

Commit

dfad7d6

·

verified ·

1 Parent(s): b5b1cdd

Update README.md

Files changed (1) hide show

README.md +4 -5

README.md CHANGED Viewed

@@ -29,7 +29,6 @@ Static quants of [`Qwen/Qwen3-Reranker-0.6B`](https://huggingface.co/Qwen/Qwen3-
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.Q5_K_M.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:Q5_K_M` | Q5_K_M | 444.2MB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.Q6_K.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:Q6_K` | Q6_K | 494.9MB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.Q8_0.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:Q8_0` | Q8_0 | 639.2MB |
-| [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.MXFP4.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:MXFP4` | MXFP4 | 639.2MB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.F16.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:F16` | F16 | 1.2GB |
 > [!TIP]
@@ -49,7 +48,7 @@ brew install nodejs
 ### CLI
 Chat with the model:
 ```bash
-npx -y node-llama-cpp chat hf:giladgd/Qwen3-Reranker-0.6B-GGUF:MXFP4
 ```
 ### Code
@@ -61,7 +60,7 @@ npm install node-llama-cpp
 ```typescript
 import {getLlama, resolveModelFile, LlamaChatSession} from "node-llama-cpp";
-const modelUri = "hf:giladgd/Qwen3-Reranker-0.6B-GGUF:MXFP4";
 const llama = await getLlama();
@@ -94,10 +93,10 @@ brew install llama.cpp
 ### CLI
 ```bash
-llama-cli -hf giladgd/Qwen3-Reranker-0.6B-GGUF:MXFP4 -p "The meaning to life and the universe is"
 ```
 ### Server
 ```bash
-llama-server -hf giladgd/Qwen3-Reranker-0.6B-GGUF:MXFP4 -c 2048
 ```

 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.Q5_K_M.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:Q5_K_M` | Q5_K_M | 444.2MB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.Q6_K.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:Q6_K` | Q6_K | 494.9MB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.Q8_0.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:Q8_0` | Q8_0 | 639.2MB |
 | [GGUF](https://huggingface.co/giladgd/Qwen3-Reranker-0.6B-GGUF/resolve/main/Qwen3-Reranker-0.6B.F16.gguf) | `hf:giladgd/Qwen3-Reranker-0.6B-GGUF:F16` | F16 | 1.2GB |
 > [!TIP]
 ### CLI
 Chat with the model:
 ```bash
+npx -y node-llama-cpp chat hf:giladgd/Qwen3-Reranker-0.6B-GGUF:Q8_0
 ```
 ### Code
 ```typescript
 import {getLlama, resolveModelFile, LlamaChatSession} from "node-llama-cpp";
+const modelUri = "hf:giladgd/Qwen3-Reranker-0.6B-GGUF:Q8_0";
 const llama = await getLlama();
 ### CLI
 ```bash
+llama-cli -hf giladgd/Qwen3-Reranker-0.6B-GGUF:Q8_0 -p "The meaning to life and the universe is"
 ```
 ### Server
 ```bash
+llama-server -hf giladgd/Qwen3-Reranker-0.6B-GGUF:Q8_0 -c 2048
 ```