optimum
/

bge-base-en-v1.5-neuronx

@@ -1,6 +1,4 @@
 {
-  "_attn_implementation_autoset": true,
-  "_name_or_path": "/tmp/tmp55lzbkct",
   "architectures": [
     "BertModel"
   ],
@@ -26,35 +24,30 @@
     "auto_cast": "matmul",
     "auto_cast_type": "bf16",
     "compiler_type": "neuronx-cc",
-    "compiler_version": "2.16.372.0+4a9b2326",
     "disable_fallback": false,
     "disable_fast_relayout": false,
     "dynamic_batch_size": false,
     "inline_weights_to_neff": true,
-    "input_names": [
-      "input_ids",
-      "attention_mask"
-    ],
     "model_type": "transformer",
     "optlevel": "2",
     "output_attentions": false,
     "output_hidden_states": false,
-    "output_names": [
-      "token_embeddings",
-      "sentence_embedding"
-    ],
-    "static_batch_size": 1,
-    "static_sequence_length": 384,
     "tensor_parallel_size": 1
   },
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
-  "task": "feature-extraction",
   "torch_dtype": "float32",
   "torchscript": true,
-  "transformers_version": "4.49.0",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 30522

 {
   "architectures": [
     "BertModel"
   ],
     "auto_cast": "matmul",
     "auto_cast_type": "bf16",
     "compiler_type": "neuronx-cc",
+    "compiler_version": "2.21.18209.0+043b1bf7",
     "disable_fallback": false,
     "disable_fast_relayout": false,
     "dynamic_batch_size": false,
+    "float_dtype": "fp32",
     "inline_weights_to_neff": true,
+    "instance_type": "trn1",
+    "int_dtype": "int64",
     "model_type": "transformer",
     "optlevel": "2",
     "output_attentions": false,
     "output_hidden_states": false,
+    "static_batch_size": 2,
+    "static_sequence_length": 512,
+    "task": "feature-extraction",
     "tensor_parallel_size": 1
   },
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
   "torchscript": true,
+  "transformers_version": "4.55.4",
   "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 30522