Spaces:

Fraser
/

web-chat

Running

App Files Files Community

Fraser commited on Aug 19

Commit

c3a5909

1 Parent(s): 2ff8d2f

undo

Browse files

Files changed (1) hide show

index.html +15 -18

index.html CHANGED Viewed

@@ -75,10 +75,6 @@
         <div class="note">Note: official <a href="https://huggingface.co/google/gemma-3-270m" target="_blank" rel="noreferrer">Gemma‑3‑270M</a> is the base HF repo. A ready‑to‑use public GGUF is now available at <a href="https://huggingface.co/ggml-org/gemma-3-270m-GGUF" target="_blank" rel="noreferrer">ggml‑org/gemma‑3‑270m‑GGUF</a> (currently providing <code>gemma-3-270m-Q8_0.gguf</code> ≈292 MB). For maximum speed on low‑RAM phones, the OpenELM‑270M‑Instruct Q3_K_S option above is even lighter, but Gemma‑3‑270M offers strong quality for its size.</div>
       </details>
-      <div class="row">
-        <label class="tiny">Default instructions (Gemma style)</label>
-        <input id="defaultInstr" type="text" placeholder="(optional) e.g., Answer concisely and clearly." class="grow" />
-      </div>
       <div class="row">
         <label>Max new tokens</label>
         <input id="nPredict" type="number" min="1" max="512" step="1" value="128" />
@@ -134,7 +130,6 @@
     const $customBox = document.getElementById('customBox');
     const $customRepo = document.getElementById('customRepo');
     const $customFile = document.getElementById('customFile');
-    const $defaultInstr = document.getElementById('defaultInstr');
     // ——— State ———
     const decoder = new TextDecoder();
@@ -157,14 +152,25 @@
       }
     };
-    const messages = [];
     // ——— Chat template for Gemma IT ———
     const GEMMA_JINJA = `{{ bos_token }}
-{%- for message in messages -%}
   {%- set role = (message['role'] == 'assistant') and 'model' or message['role'] -%}
 <start_of_turn>{{ role }}
-{{ (message['content'] if message['content'] is string else message['content'][0]['text']) | trim }}<end_of_turn>
 {%- endfor -%}
 {%- if add_generation_prompt -%}
 <start_of_turn>model
@@ -264,16 +270,7 @@
       if (!text) return;
       await ensureLoaded();
-      let composed = text;
-      if (isGemmaSelected()) {
-        const instr = ($defaultInstr.value || '').trim();
-        if (instr) composed = instr + "
-" + composed;
-      } else {
-        if (messages.length === 0 && sysPrompt) messages.unshift({ role: 'system', content: sysPrompt });
-      }
-      messages.push({ role: 'user', content: composed });
       const userBubble = ui.add('user', text);
       $input.value = '';

         <div class="note">Note: official <a href="https://huggingface.co/google/gemma-3-270m" target="_blank" rel="noreferrer">Gemma‑3‑270M</a> is the base HF repo. A ready‑to‑use public GGUF is now available at <a href="https://huggingface.co/ggml-org/gemma-3-270m-GGUF" target="_blank" rel="noreferrer">ggml‑org/gemma‑3‑270m‑GGUF</a> (currently providing <code>gemma-3-270m-Q8_0.gguf</code> ≈292 MB). For maximum speed on low‑RAM phones, the OpenELM‑270M‑Instruct Q3_K_S option above is even lighter, but Gemma‑3‑270M offers strong quality for its size.</div>
       </details>
       <div class="row">
         <label>Max new tokens</label>
         <input id="nPredict" type="number" min="1" max="512" step="1" value="128" />
     const $customBox = document.getElementById('customBox');
     const $customRepo = document.getElementById('customRepo');
     const $customFile = document.getElementById('customFile');
     // ——— State ———
     const decoder = new TextDecoder();
       }
     };
+    const messages = [ { role: "system", content: sysPrompt } ];
     // ——— Chat template for Gemma IT ———
     const GEMMA_JINJA = `{{ bos_token }}
+{%- if messages[0]['role'] == 'system' -%}
+  {%- if messages[0]['content'] is string -%}
+    {%- set first_user_prefix = messages[0]['content'] + '\n\n' -%}
+  {%- else -%}
+    {%- set first_user_prefix = messages[0]['content'][0]['text'] + '\n\n' -%}
+  {%- endif -%}
+  {%- set loop_messages = messages[1:] -%}
+{%- else -%}
+  {%- set first_user_prefix = "" -%}
+  {%- set loop_messages = messages -%}
+{%- endif -%}
+{%- for message in loop_messages -%}
   {%- set role = (message['role'] == 'assistant') and 'model' or message['role'] -%}
 <start_of_turn>{{ role }}
+{{ (loop.first and first_user_prefix or '') ~ (message['content'] if message['content'] is string else message['content'][0]['text']) | trim }}<end_of_turn>
 {%- endfor -%}
 {%- if add_generation_prompt -%}
 <start_of_turn>model
       if (!text) return;
       await ensureLoaded();
+      messages.push({ role: 'user', content: text });
       const userBubble = ui.add('user', text);
       $input.value = '';