Xenova HF Staff commited on 10 days ago

Commit

5e500c2

verified ·

1 Parent(s): 50fa719

Upload folder using huggingface_hub

Browse files

Files changed (20) hide show

.gitattributes +9 -0
chat_template.jinja +52 -0
config.json +48 -0
generation_config.json +8 -0
onnx/model.onnx +3 -0
onnx/model.onnx_data +3 -0
onnx/model.onnx_data_1 +3 -0
onnx/model.onnx_data_2 +3 -0
onnx/model.onnx_data_3 +3 -0
onnx/model_fp16.onnx +3 -0
onnx/model_fp16.onnx_data +3 -0
onnx/model_fp16.onnx_data_1 +3 -0
onnx/model_q4.onnx +3 -0
onnx/model_q4.onnx_data +3 -0
onnx/model_q4.onnx_data_1 +3 -0
onnx/model_q4f16.onnx +3 -0
onnx/model_q4f16.onnx_data +3 -0
special_tokens_map.json +32 -0
tokenizer.json +0 -0
tokenizer_config.json +97 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,12 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+onnx/model.onnx_data filter=lfs diff=lfs merge=lfs -text
+onnx/model.onnx_data_1 filter=lfs diff=lfs merge=lfs -text
+onnx/model.onnx_data_2 filter=lfs diff=lfs merge=lfs -text
+onnx/model.onnx_data_3 filter=lfs diff=lfs merge=lfs -text
+onnx/model_fp16.onnx_data filter=lfs diff=lfs merge=lfs -text
+onnx/model_fp16.onnx_data_1 filter=lfs diff=lfs merge=lfs -text
+onnx/model_q4.onnx_data filter=lfs diff=lfs merge=lfs -text
+onnx/model_q4.onnx_data_1 filter=lfs diff=lfs merge=lfs -text
+onnx/model_q4f16.onnx_data filter=lfs diff=lfs merge=lfs -text

chat_template.jinja ADDED Viewed

	@@ -0,0 +1,52 @@

+{{- bos_token }}
+{%- if messages[0]['role'] == 'system' -%}
+    {%- if messages[1] is not defined or messages[1]['role'] != 'user' -%}
+        {{- raise_exception("System message must be followed by a user message") }}
+    {%- endif -%}
+    {%- set system_content = messages[0]['content'] -%}
+    {%- set loop_messages = messages[1:] -%}
+    {%- set first_user_has_system = true -%}
+{%- else -%}
+    {%- set system_content = "" -%}
+    {%- set loop_messages = messages -%}
+    {%- set first_user_has_system = false -%}
+{%- endif -%}
+{%- for message in loop_messages -%}
+    {%- if (message['role'] == 'user') != (loop.index0 % 2 == 0) -%}
+        {{- raise_exception("Conversation roles must alternate user/assistant/user/assistant/...") }}
+    {%- endif -%}
+    {%- if message['role'] == 'user' -%}
+        {{- '<|user_start|>' }}
+        {%- if loop.first and first_user_has_system -%}
+            {{- system_content + '\n\n' }}
+        {%- endif -%}
+        {%- if message['content'] is not string -%}
+            {{- raise_exception("User messages must contain string content") }}
+        {%- endif -%}
+        {{- message['content'] }}
+        {{- '<|user_end|>' }}
+    {%- elif message['role'] == 'assistant' -%}
+        {{- '<|assistant_start|>' }}
+        {%- if message['content'] is string -%}
+            {{- message['content'] }}
+        {%- elif message['content'] is iterable -%}
+            {%- for part in message['content'] -%}
+                {%- if part['type'] == 'text' -%}
+                    {{- part.get('text', '') }}
+                {%- elif part['type'] == 'python' -%}
+                    {{- '<|python_start|>' + part.get('text', '') + '<|python_end|>' }}
+                {%- elif part['type'] == 'python_output' -%}
+                    {{- '<|output_start|>' + part.get('text', '') + '<|output_end|>' }}
+                {%- else -%}
+                    {{- raise_exception("Unknown assistant content part: " + part['type']) }}
+                {%- endif -%}
+            {%- endfor -%}
+        {%- else -%}
+            {{- raise_exception("Unsupported assistant content type") }}
+        {%- endif -%}
+        {{- '<|assistant_end|>' }}
+    {%- endif -%}
+{%- endfor -%}
+{%- if add_generation_prompt -%}
+    {{- '<|assistant_start|>' }}
+{%- endif -%}

config.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "architectures": [
+    "NanoChatForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token": "<|bos|>",
+  "bos_token_id": 0,
+  "chat_template": "{% if messages[0]['role'] == 'system' %}<|bos|><|user_start|>{{ messages[0]['content'] }}\n\n{{ messages[1]['content'] }}<|user_end|>{% set messages = messages[2:] %}{% else %}<|bos|>{% endif %}{% for message in messages %}{% if loop.index0 % 2 == 0 %}<|user_start|>{{ message['content'] }}<|user_end|>{% else %}<|assistant_start|>{{ message['content'] }}<|assistant_end|>{% endif %}{% endfor %}",
+  "dtype": "bfloat16",
+  "eos_token": "<|assistant_end|>",
+  "eos_token_id": 65531,
+  "hidden_act": "relu2",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "logits_soft_cap": 15.0,
+  "max_position_embeddings": 2048,
+  "model_type": "nanochat",
+  "n_embd": 2048,
+  "n_head": 16,
+  "n_layer": 32,
+  "num_attention_heads": 16,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 16,
+  "pad_token": "<|assistant_end|>",
+  "pad_token_id": 65531,
+  "qkv_bias": false,
+  "resid_dropout": 0.0,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "transformers_version": "4.57.0",
+  "use_cache": true,
+  "vocab_size": 65536,
+  "transformers.js_config": {
+    "use_external_data_format": {
+      "model.onnx": 4,
+      "model_fp16.onnx": 2,
+      "model_q4.onnx": 2,
+      "model_q4f16.onnx": 1
+    },
+    "kv_cache_dtype": {
+      "q4f16": "float16",
+      "fp16": "float16"
+    }
+  }
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+  "bos_token_id": 50256,
+  "eos_token_id": [
+    50256,
+    65531
+  ],
+  "transformers_version": "4.57.0"
+}

onnx/model.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c677af793b923e543aad0342a4b061c14e1d6be0ca8d924764279bbb0c598cc4
+size 465675

onnx/model.onnx_data ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd405d4e79f9fbecef3f263ba5b0e9111237436235f7d45d9eff0131a38052ee
+size 2081562624

onnx/model.onnx_data_1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17ec1a458031beb774bd714dc8498a58171605486eaabe988c08e5a8159b5e56
+size 2080546816

onnx/model.onnx_data_2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:65d5d764574b10c62ba75efc9c8b8de859bf752a49ed001e02fde05becf05bf2
+size 2080546816

onnx/model.onnx_data_3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0eaa7769e344e834be8cfe3d7ff9d1bffc6e6d927b5c50b39134dc6b594528fe
+size 1275125760

onnx/model_fp16.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19b66a4e151601442ee3e14976dd20c13053c3a4bd357ae987e1e7f44151df3d
+size 560294

onnx/model_fp16.onnx_data ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a0a1d5ec6e921fc912def8f7162609230bf4c9be4509cc1e136d9bbc87c04fe
+size 2089598976

onnx/model_fp16.onnx_data_1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef4617f06937f7c88e2a60619f2d900c08508b574a72719707c494831052f9c8
+size 1669562368

onnx/model_q4.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e94739ecf6a1e3ff12e420dd870c971fb6bcfe1d1a6e6277e16780e7bdfcfa1
+size 543776

onnx/model_q4.onnx_data ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f11242e6687f1fe27d3621052caf112d76ab6d9f36d1324a51c8be7d4c93c086
+size 2095529984

onnx/model_q4.onnx_data_1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:897e660a4658272e64020ca4ee403a3e9ac9176dda8e0ca5003897c335eb9095
+size 744292352

onnx/model_q4f16.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:729175f0c09338c6cbfbd12be4b9a3eff69e2aa32f85a759295666675b7b617c
+size 638756

onnx/model_q4f16.onnx_data ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:876fe7d956f5f968eb9957199ef612e05428180ce02a11c6ad93e4bebabf0717
+size 1761296384

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "additional_special_tokens": [
+    "<|user_start|>",
+    "<|user_end|>",
+    "<|assistant_start|>",
+    "<|python_start|>",
+    "<|python_end|>",
+    "<|output_start|>",
+    "<|output_end|>"
+  ],
+  "bos_token": {
+    "content": "<|bos|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|assistant_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|assistant_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,97 @@

+{
+  "added_tokens_decoder": {
+    "65527": {
+      "content": "<|bos|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "65528": {
+      "content": "<|user_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "65529": {
+      "content": "<|user_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "65530": {
+      "content": "<|assistant_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "65531": {
+      "content": "<|assistant_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "65532": {
+      "content": "<|python_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "65533": {
+      "content": "<|python_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "65534": {
+      "content": "<|output_start|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "65535": {
+      "content": "<|output_end|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<|user_start|>",
+    "<|user_end|>",
+    "<|assistant_start|>",
+    "<|python_start|>",
+    "<|python_end|>",
+    "<|output_start|>",
+    "<|output_end|>"
+  ],
+  "bos_token": "<|bos|>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|assistant_end|>",
+  "extra_special_tokens": {},
+  "model_input_names": [
+    "input_ids",
+    "attention_mask"
+  ],
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<|assistant_end|>",
+  "tokenizer_class": "PreTrainedTokenizerFast",
+  "chat_template": "{{- bos_token }}\n{%- if messages[0]['role'] == 'system' -%}\n    {%- if messages[1] is not defined or messages[1]['role'] != 'user' -%}\n        {{- raise_exception(\"System message must be followed by a user message\") }}\n    {%- endif -%}\n    {%- set system_content = messages[0]['content'] -%}\n    {%- set loop_messages = messages[1:] -%}\n    {%- set first_user_has_system = true -%}\n{%- else -%}\n    {%- set system_content = \"\" -%}\n    {%- set loop_messages = messages -%}\n    {%- set first_user_has_system = false -%}\n{%- endif -%}\n{%- for message in loop_messages -%}\n    {%- if (message['role'] == 'user') != (loop.index0 % 2 == 0) -%}\n        {{- raise_exception(\"Conversation roles must alternate user/assistant/user/assistant/...\") }}\n    {%- endif -%}\n    {%- if message['role'] == 'user' -%}\n        {{- '<|user_start|>' }}\n        {%- if loop.first and first_user_has_system -%}\n            {{- system_content + '\\n\\n' }}\n        {%- endif -%}\n        {%- if message['content'] is not string -%}\n            {{- raise_exception(\"User messages must contain string content\") }}\n        {%- endif -%}\n        {{- message['content'] }}\n        {{- '<|user_end|>' }}\n    {%- elif message['role'] == 'assistant' -%}\n        {{- '<|assistant_start|>' }}\n        {%- if message['content'] is string -%}\n            {{- message['content'] }}\n        {%- elif message['content'] is iterable -%}\n            {%- for part in message['content'] -%}\n                {%- if part['type'] == 'text' -%}\n                    {{- part.get('text', '') }}\n                {%- elif part['type'] == 'python' -%}\n                    {{- '<|python_start|>' + part.get('text', '') + '<|python_end|>' }}\n                {%- elif part['type'] == 'python_output' -%}\n                    {{- '<|output_start|>' + part.get('text', '') + '<|output_end|>' }}\n                {%- else -%}\n                    {{- raise_exception(\"Unknown assistant content part: \" + part['type']) }}\n                {%- endif -%}\n            {%- endfor -%}\n        {%- else -%}\n            {{- raise_exception(\"Unsupported assistant content type\") }}\n        {%- endif -%}\n        {{- '<|assistant_end|>' }}\n    {%- endif -%}\n{%- endfor -%}\n{%- if add_generation_prompt -%}\n    {{- '<|assistant_start|>' }}\n{%- endif -%}\n"
+}