Spaces:

KGBrain
/

Causal-pipeline

Runtime error

App Files Files Community

KGBrain commited on Dec 1, 2023

Commit

5a0bdb1

1 Parent(s): 66c3bf1

Upload 7 files

Browse files

Files changed (7) hide show

checkpoint-2850/checkpoint-2850_config.json +27 -0
checkpoint-2850/checkpoint-2850_trainer_state.json +184 -0
checkpoint-2850/optimizer.pt +3 -0
checkpoint-2850/pytorch_model.bin +3 -0
checkpoint-2850/rng_state.pth +3 -0
checkpoint-2850/scheduler.pt +3 -0
checkpoint-2850/training_args.bin +3 -0

checkpoint-2850/checkpoint-2850_config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "/app/ima-pipeline/checkpoint-2850",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.23.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

checkpoint-2850/checkpoint-2850_trainer_state.json ADDED Viewed

	@@ -0,0 +1,184 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 6.0,
+  "global_step": 2850,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.21,
+      "learning_rate": 1e-05,
+      "loss": 0.65,
+      "step": 100
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 2e-05,
+      "loss": 0.4943,
+      "step": 200
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 3e-05,
+      "loss": 0.4019,
+      "step": 300
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 4e-05,
+      "loss": 0.4193,
+      "step": 400
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 5e-05,
+      "loss": 0.3961,
+      "step": 500
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 4.787234042553192e-05,
+      "loss": 0.324,
+      "step": 600
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 4.574468085106383e-05,
+      "loss": 0.3471,
+      "step": 700
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 4.3617021276595746e-05,
+      "loss": 0.287,
+      "step": 800
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 4.148936170212766e-05,
+      "loss": 0.2373,
+      "step": 900
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 3.936170212765958e-05,
+      "loss": 0.2729,
+      "step": 1000
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 3.723404255319149e-05,
+      "loss": 0.1955,
+      "step": 1100
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 3.5106382978723407e-05,
+      "loss": 0.1929,
+      "step": 1200
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 3.2978723404255317e-05,
+      "loss": 0.1849,
+      "step": 1300
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 3.085106382978723e-05,
+      "loss": 0.2012,
+      "step": 1400
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 2.8723404255319154e-05,
+      "loss": 0.152,
+      "step": 1500
+    },
+    {
+      "epoch": 3.37,
+      "learning_rate": 2.6595744680851064e-05,
+      "loss": 0.1388,
+      "step": 1600
+    },
+    {
+      "epoch": 3.58,
+      "learning_rate": 2.446808510638298e-05,
+      "loss": 0.1337,
+      "step": 1700
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 2.2340425531914894e-05,
+      "loss": 0.1571,
+      "step": 1800
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 2.0212765957446807e-05,
+      "loss": 0.1088,
+      "step": 1900
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 1.8085106382978724e-05,
+      "loss": 0.0701,
+      "step": 2000
+    },
+    {
+      "epoch": 4.42,
+      "learning_rate": 1.595744680851064e-05,
+      "loss": 0.0853,
+      "step": 2100
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 1.3829787234042554e-05,
+      "loss": 0.0923,
+      "step": 2200
+    },
+    {
+      "epoch": 4.84,
+      "learning_rate": 1.170212765957447e-05,
+      "loss": 0.0695,
+      "step": 2300
+    },
+    {
+      "epoch": 5.05,
+      "learning_rate": 9.574468085106383e-06,
+      "loss": 0.0867,
+      "step": 2400
+    },
+    {
+      "epoch": 5.26,
+      "learning_rate": 7.446808510638298e-06,
+      "loss": 0.0371,
+      "step": 2500
+    },
+    {
+      "epoch": 5.47,
+      "learning_rate": 5.319148936170213e-06,
+      "loss": 0.0201,
+      "step": 2600
+    },
+    {
+      "epoch": 5.68,
+      "learning_rate": 3.1914893617021277e-06,
+      "loss": 0.0141,
+      "step": 2700
+    },
+    {
+      "epoch": 5.89,
+      "learning_rate": 1.0638297872340427e-06,
+      "loss": 0.1063,
+      "step": 2800
+    }
+  ],
+  "max_steps": 2850,
+  "num_train_epochs": 6,
+  "total_flos": 5994196063211520.0,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-2850/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba0d77af1f9e7a34b546b51c07d09035fceb336535ca4f2cb72377cbe714fe66
+size 875986717

checkpoint-2850/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eb1a174d11ddbc7f8955d103282c64b80565983c764ae0970c0e62f444168ab2
+size 438006125

checkpoint-2850/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:940fa184d4c2b298e43ad53d3c9657db9d82d2f407bbb56fea7e7580bbfc0794
+size 14503

checkpoint-2850/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83d5f77dfee1d66c0677d3545953b60e43193c44e2734ad6c1c26a65be1bedfa
+size 623

checkpoint-2850/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a09c3389593c911ce6e4ce29fbc9dd2ed17c401f7b4a90bcb3cc0c5eda6234b
+size 3311