open_pt_llm_leaderboard

Running on CPU Upgrade

App Files Files Community

eduagarcia commited on Apr 3, 2024

Commit

6da7311

1 Parent(s): fbd2a73

Add new column: Main Language

Browse files

Files changed (6) hide show

.gitignore +1 -0
app.py +26 -5
initial_queue.jsonl +196 -196
src/display/utils.py +24 -1
src/leaderboard/read_evals.py +6 -2
src/submission/submit.py +3 -1

.gitignore CHANGED Viewed

@@ -17,3 +17,4 @@ downloads/
 tasks_config/legal_config.yaml
 src/assets/model_counts.html

 tasks_config/legal_config.yaml
 src/assets/model_counts.html
+languages.jsonl

app.py CHANGED Viewed

@@ -29,7 +29,8 @@ from src.display.utils import (
     fields,
     WeightType,
     Precision,
-    Tasks
 )
 from src.envs import (
     API,
@@ -125,10 +126,11 @@ def update_table(
     type_query: list,
     precision_query: str,
     size_query: list,
     hide_models: list,
     query: str,
 ):
-    filtered_df = filter_models(df=hidden_df, type_query=type_query, size_query=size_query, precision_query=precision_query, hide_models=hide_models)
     filtered_df = filter_queries(query, filtered_df)
     filtered_df = update_leaderboard_avg_scores(filtered_df, columns)
     df = select_columns(filtered_df, columns)
@@ -177,7 +179,7 @@ def filter_queries(query: str, filtered_df: pd.DataFrame):
 def filter_models(
-    df: pd.DataFrame, type_query: list, size_query: list, precision_query: list, hide_models: list
 ) -> pd.DataFrame:
     # Show all models
     if "Private or deleted" in hide_models:
@@ -197,6 +199,7 @@ def filter_models(
     type_emoji = [t[0] for t in type_query]
     filtered_df = filtered_df.loc[df[AutoEvalColumn.model_type_symbol.name].isin(type_emoji)]
     filtered_df = filtered_df.loc[df[AutoEvalColumn.precision.name].isin(precision_query + ["None"])]
     numeric_interval = pd.IntervalIndex(sorted([NUMERIC_INTERVALS[s] for s in size_query]))
     params_column = pd.to_numeric(df[AutoEvalColumn.params.name], errors="coerce")
@@ -225,6 +228,7 @@ leaderboard_df = filter_models(
     type_query=[t.to_str(" : ") for t in ModelType],
     size_query=list(NUMERIC_INTERVALS.keys()),
     precision_query=[i.value.name for i in Precision],
     hide_models=["Contains a merge/moerge", "Flagged"], # "Private or deleted", "Contains a merge/moerge", "Flagged"
 )
@@ -289,6 +293,13 @@ with demo:
                         interactive=True,
                         elem_id="filter-columns-size",
                     )
             leaderboard_table = gr.components.Dataframe(
                 value=leaderboard_df[
@@ -319,6 +330,7 @@ with demo:
                     filter_columns_type,
                     filter_columns_precision,
                     filter_columns_size,
                     hide_models,
                     search_bar,
                 ],
@@ -335,6 +347,7 @@ with demo:
                     filter_columns_type,
                     filter_columns_precision,
                     filter_columns_size,
                     hide_models,
                     search_bar,
                 ],
@@ -343,7 +356,7 @@ with demo:
             # Check query parameter once at startup and update search bar + hidden component
             demo.load(load_query, inputs=[], outputs=[search_bar, hidden_search_bar])
-            for selector in [shown_columns, filter_columns_type, filter_columns_precision, filter_columns_size, hide_models]:
                 selector.change(
                     update_table,
                     [
@@ -352,6 +365,7 @@ with demo:
                         filter_columns_type,
                         filter_columns_precision,
                         filter_columns_size,
                         hide_models,
                         search_bar,
                     ],
@@ -455,6 +469,13 @@ with demo:
                         value=ModelType.FT.to_str(" : "),
                         interactive=True,
                     )
                 with gr.Column():
                     precision = gr.Dropdown(
@@ -472,7 +493,6 @@ with demo:
                         interactive=True,
                     )
                     base_model_name_textbox = gr.Textbox(label="Base model (for delta or adapter weights)")
             submit_button = gr.Button("Submit Eval")
             submission_result = gr.Markdown()
             submit_button.click(
@@ -485,6 +505,7 @@ with demo:
                     private,
                     weight_type,
                     model_type,
                 ],
                 submission_result,
             )

     fields,
     WeightType,
     Precision,
+    Tasks,
+    Language
 )
 from src.envs import (
     API,
     type_query: list,
     precision_query: str,
     size_query: list,
+    language_query: list,
     hide_models: list,
     query: str,
 ):
+    filtered_df = filter_models(df=hidden_df, type_query=type_query, size_query=size_query, language_query=language_query, precision_query=precision_query, hide_models=hide_models)
     filtered_df = filter_queries(query, filtered_df)
     filtered_df = update_leaderboard_avg_scores(filtered_df, columns)
     df = select_columns(filtered_df, columns)
 def filter_models(
+    df: pd.DataFrame, type_query: list, size_query: list, language_query: list, precision_query: list, hide_models: list
 ) -> pd.DataFrame:
     # Show all models
     if "Private or deleted" in hide_models:
     type_emoji = [t[0] for t in type_query]
     filtered_df = filtered_df.loc[df[AutoEvalColumn.model_type_symbol.name].isin(type_emoji)]
     filtered_df = filtered_df.loc[df[AutoEvalColumn.precision.name].isin(precision_query + ["None"])]
+    filtered_df = filtered_df.loc[df[AutoEvalColumn.main_language.name].isin(language_query + ["None"])]
     numeric_interval = pd.IntervalIndex(sorted([NUMERIC_INTERVALS[s] for s in size_query]))
     params_column = pd.to_numeric(df[AutoEvalColumn.params.name], errors="coerce")
     type_query=[t.to_str(" : ") for t in ModelType],
     size_query=list(NUMERIC_INTERVALS.keys()),
     precision_query=[i.value.name for i in Precision],
+    language_query=[i.value.name for i in Language],
     hide_models=["Contains a merge/moerge", "Flagged"], # "Private or deleted", "Contains a merge/moerge", "Flagged"
 )
                         interactive=True,
                         elem_id="filter-columns-size",
                     )
+                    filter_columns_language = gr.CheckboxGroup(
+                        label="Model Main Language",
+                        choices=[i.value.name for i in Language],
+                        value=[i.value.name for i in Language],
+                        interactive=True,
+                        elem_id="filter-columns-language",
+                    )
             leaderboard_table = gr.components.Dataframe(
                 value=leaderboard_df[
                     filter_columns_type,
                     filter_columns_precision,
                     filter_columns_size,
+                    filter_columns_language,
                     hide_models,
                     search_bar,
                 ],
                     filter_columns_type,
                     filter_columns_precision,
                     filter_columns_size,
+                    filter_columns_language,
                     hide_models,
                     search_bar,
                 ],
             # Check query parameter once at startup and update search bar + hidden component
             demo.load(load_query, inputs=[], outputs=[search_bar, hidden_search_bar])
+            for selector in [shown_columns, filter_columns_type, filter_columns_precision, filter_columns_size, filter_columns_language, hide_models]:
                 selector.change(
                     update_table,
                     [
                         filter_columns_type,
                         filter_columns_precision,
                         filter_columns_size,
+                        filter_columns_language,
                         hide_models,
                         search_bar,
                     ],
                         value=ModelType.FT.to_str(" : "),
                         interactive=True,
                     )
+                    main_language = gr.Dropdown(
+                        choices=[i.value.name for i in Language if i != Language.Unknown],
+                        label="Main Language",
+                        multiselect=False,
+                        value="English",
+                        interactive=True,
+                    )
                 with gr.Column():
                     precision = gr.Dropdown(
                         interactive=True,
                     )
                     base_model_name_textbox = gr.Textbox(label="Base model (for delta or adapter weights)")
             submit_button = gr.Button("Submit Eval")
             submission_result = gr.Markdown()
             submit_button.click(
                     private,
                     weight_type,
                     model_type,
+                    main_language
                 ],
                 submission_result,
             )

initial_queue.jsonl CHANGED Viewed

@@ -1,215 +1,215 @@
 // 1- base models <=7B
-{"model": "TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "meta-llama/Llama-2-7b-hf", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "mistralai/Mistral-7B-v0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "huggyllama/llama-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openlm-research/open_llama_3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openlm-research/open_llama_3b_v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openlm-research/open_llama_7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openlm-research/open_llama_7b_v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 // 2 - Larger base models <= 13B
-{"model": "meta-llama/Llama-2-13b-hf", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "huggyllama/llama-13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openlm-research/open_llama_13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "upstage/SOLAR-10.7B-v1.0", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 // 3 - portuguese models
-{"model": "maritaca-ai/sabia-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "dominguesm/canarim-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "22h/open-cabrita3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "recogna-nlp/bode-7b-alpaca-pt-br", "base_model": "meta-llama/Llama-2-7b-chat-hf", "revision": "main", "precision": "float16", "weight_type": "Adapter", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
-{"model": "recogna-nlp/bode-13b-alpaca-pt-br", "base_model": "meta-llama/Llama-2-13b-chat-hf", "revision": "main", "precision": "float16", "weight_type": "Adapter", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
-{"model": "22h/cabrita_7b_pt_850000", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "22h/cabrita-lora-v0-1", "base_model": "huggyllama/llama-7b", "revision": "main", "precision": "float16", "weight_type": "Adapter", "model_type": "🔶 : fine-tuned"}
-{"model": "wandgibaut/periquito-3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "nicolasdec/Cabra", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
-{"model": "nicolasdec/cabra13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
-{"model": "lrds-code/samba-1.1B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
-{"model": "lrds-code/boana-7b-instruct", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
-{"model": "nicholasKluge/Aira-2-portuguese-124M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
-{"model": "nicholasKluge/Aira-2-portuguese-560M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
-{"model": "nicholasKluge/Aira-2-portuguese-1B7", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
 // other must-have <=7B
-{"model": "dynamofl/dynamo-8B-v0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "01-ai/Yi-6B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "Unbabel/TowerBase-7B-v0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "tiiuae/falcon-7b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "bigscience/bloom-560m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "bigscience/bloom-1b7", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "bigscience/bloom-3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "bigscience/bloom-7b1", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "stabilityai/stablelm-2-1_6b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "stabilityai/stablelm-3b-4e1t", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 // Larger base models >13B
-{"model": "mistralai/Mixtral-8x7B-v0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "huggyllama/llama-30b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "01-ai/Yi-34B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "meta-llama/Llama-2-70b-hf", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "huggyllama/llama-65b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 // minors must
-{"model": "togethercomputer/RedPajama-INCITE-Base-3B-v1", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "togethercomputer/RedPajama-INCITE-7B-Base", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "DAMO-NLP-MT/polylm-1.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "DAMO-NLP-MT/polylm-13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "Deci/DeciLM-6b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "Deci/DeciLM-7B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
 // multiple (ch-jp)/en bi/multi lingual models
-{"model": "internlm/internlm2-7b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "internlm/internlm2-base-7b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "internlm/internlm-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "internlm/internlm2-20b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "internlm/internlm2-base-20b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "internlm/internlm-20b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "Qwen/Qwen-1_8B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "Qwen/Qwen-7B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "Qwen/Qwen-14B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "xverse/XVERSE-7B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "xverse/XVERSE-13B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "xverse/XVERSE-13B-256K", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "Skywork/Skywork-13B-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "baichuan-inc/Baichuan-7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "baichuan-inc/Baichuan-13B-Base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "baichuan-inc/Baichuan2-7B-Base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "baichuan-inc/Baichuan2-13B-Base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "OrionStarAI/Orion-14B-Base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "deepseek-ai/deepseek-llm-7b-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "deepseek-ai/deepseek-moe-16b-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "BAAI/Aquila-7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "BAAI/Aquila2-7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "THUDM/chatglm3-6b-base", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "THUDM/glm-2b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "THUDM/glm-10b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "fnlp/moss-moon-003-base", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "fnlp/moss-base-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 // multiple chinese/jp large
-{"model": "Qwen/Qwen-72B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "xverse/XVERSE-65B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "xverse/XVERSE-65B-2", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "deepseek-ai/deepseek-llm-67b-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "BAAI/Aquila2-34B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "BAAI/Aquila2-70B-Expr", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 // minors must 2
-{"model": "gpt2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "t5-small", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "t5-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "t5-large", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/mt5-small", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/mt5-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/mt5-large", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 //others
-{"model": "NucleusAI/nucleus-22B-token-500B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-14m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-70m-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-160m-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-410m-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-1b-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-2.8b-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-6.9b-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-12b-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/gpt-neo-125m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/gpt-neo-1.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/gpt-neo-2.7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/gpt-j-6b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/gpt-neox-20b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/opt-125m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/opt-350m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/opt-1.3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/opt-2.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/opt-6.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/opt-13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/opt-30b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 //other large
-{"model": "facebook/opt-66b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "tiiuae/falcon-40b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 // minors portuguese
-{"model": "pierreguillou/gpt2-small-portuguese", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "pucpr/gpt2-bio-pt", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "unicamp-dl/ptt5-small-portuguese-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "unicamp-dl/ptt5-base-portuguese-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "unicamp-dl/ptt5-large-portuguese-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "unicamp-dl/ptt5-small-t5-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "unicamp-dl/ptt5-base-t5-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "unicamp-dl/ptt5-large-t5-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "josu/gpt-neo-pt-br", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "josu/gpt-neo-pt-1.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "monilouise/opt125M_portuguese", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "HeyLucasLeao/gpt-neo-small-portuguese", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
 // other langs (es/Ko/Jp/nordic)
-{"model": "projecte-aina/FLOR-760M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "projecte-aina/FLOR-1.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "projecte-aina/FLOR-6.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "projecte-aina/aguila-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "EleutherAI/polyglot-ko-12.8b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "matsuo-lab/weblab-10b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "pfnet/plamo-13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "AI-Sweden-Models/gpt-sw3-6.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "AI-Sweden-Models/gpt-sw3-6.7b-v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "AI-Sweden-Models/gpt-sw3-20b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "AI-Sweden-Models/gpt-sw3-40b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "OpenLLM-France/Claire-Mistral-7B-0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
-{"model": "OpenLLM-France/Claire-7B-0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)"}
 // huge models:
 //{"model": "bigscience/bloom", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 //{"model": "tiiuae/falcon-180B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 //{"model": "facebook/galactica-120b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 //random chat models
-{"model": "openchat/openchat-3.5-0106", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)"}
 //other 2
-{"model": "stabilityai/stablelm-base-alpha-3b-v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "stabilityai/stablelm-base-alpha-7b-v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "stabilityai/stablelm-base-alpha-3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "stabilityai/stablelm-base-alpha-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openai-community/openai-gpt", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openai-community/gpt2-medium", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openai-community/gpt2-large", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "openai-community/gpt2-xl", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "microsoft/phi-1", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "microsoft/phi-1_5", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "microsoft/phi-2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "mosaicml/mpt-7b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "mosaicml/mpt-30b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "mosaicml/mpt-7b-8k", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "01-ai/Yi-6B-200K", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "01-ai/Yi-34B-200K", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/t5-v1_1-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/t5-v1_1-small", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/t5-v1_1-large", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/t5-v1_1-xl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/t5-v1_1-xxl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/mt5-xl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/mt5-xxl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/umt5-small", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/umt5-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/umt5-xl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "google/umt5-xxl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "AdaptLLM/law-LLM", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "AdaptLLM/medicine-LLM", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "AdaptLLM/finance-LLM", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "AdaptLLM/law-LLM-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "AdaptLLM/medicine-LLM-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "AdaptLLM/finance-LLM-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned"}
-{"model": "cerebras/Cerebras-GPT-111M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "cerebras/Cerebras-GPT-256M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "cerebras/Cerebras-GPT-590M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "cerebras/Cerebras-GPT-1.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "cerebras/Cerebras-GPT-2.7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "cerebras/Cerebras-GPT-6.7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "cerebras/Cerebras-GPT-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "cerebras/btlm-3b-8k-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "ai-forever/mGPT-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "ai-forever/mGPT", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-70m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-160m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-410m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-1b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-2.8b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-6.9b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "EleutherAI/pythia-12b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/galactica-125m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/galactica-1.3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/galactica-6.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/galactica-30b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/xglm-564M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/xglm-1.7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/xglm-2.9B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/xglm-4.5B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
-{"model": "facebook/xglm-7.5B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}

 // 1- base models <=7B
+{"model": "TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "meta-llama/Llama-2-7b-hf", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "mistralai/Mistral-7B-v0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "huggyllama/llama-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openlm-research/open_llama_3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openlm-research/open_llama_3b_v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openlm-research/open_llama_7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openlm-research/open_llama_7b_v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
 // 2 - Larger base models <= 13B
+{"model": "meta-llama/Llama-2-13b-hf", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "huggyllama/llama-13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openlm-research/open_llama_13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "upstage/SOLAR-10.7B-v1.0", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
 // 3 - portuguese models
+{"model": "maritaca-ai/sabia-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "dominguesm/canarim-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "22h/open-cabrita3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "recogna-nlp/bode-7b-alpaca-pt-br", "base_model": "meta-llama/Llama-2-7b-chat-hf", "revision": "main", "precision": "float16", "weight_type": "Adapter", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
+{"model": "recogna-nlp/bode-13b-alpaca-pt-br", "base_model": "meta-llama/Llama-2-13b-chat-hf", "revision": "main", "precision": "float16", "weight_type": "Adapter", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
+{"model": "22h/cabrita_7b_pt_850000", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "22h/cabrita-lora-v0-1", "base_model": "huggyllama/llama-7b", "revision": "main", "precision": "float16", "weight_type": "Adapter", "model_type": "🔶 : fine-tuned", "main_language": "Portuguese"}
+{"model": "wandgibaut/periquito-3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "nicolasdec/Cabra", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
+{"model": "nicolasdec/cabra13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
+{"model": "lrds-code/samba-1.1B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
+{"model": "lrds-code/boana-7b-instruct", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
+{"model": "nicholasKluge/Aira-2-portuguese-124M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
+{"model": "nicholasKluge/Aira-2-portuguese-560M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
+{"model": "nicholasKluge/Aira-2-portuguese-1B7", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "Portuguese"}
 // other must-have <=7B
+{"model": "dynamofl/dynamo-8B-v0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "English"}
+{"model": "01-ai/Yi-6B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "Unbabel/TowerBase-7B-v0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "English"}
+{"model": "tiiuae/falcon-7b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "bigscience/bloom-560m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "bigscience/bloom-1b7", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "bigscience/bloom-3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "bigscience/bloom-7b1", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "stabilityai/stablelm-2-1_6b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "stabilityai/stablelm-3b-4e1t", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
 // Larger base models >13B
+{"model": "mistralai/Mixtral-8x7B-v0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "huggyllama/llama-30b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "01-ai/Yi-34B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "meta-llama/Llama-2-70b-hf", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "huggyllama/llama-65b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
 // minors must
+{"model": "togethercomputer/RedPajama-INCITE-Base-3B-v1", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "togethercomputer/RedPajama-INCITE-7B-Base", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "DAMO-NLP-MT/polylm-1.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "DAMO-NLP-MT/polylm-13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "Deci/DeciLM-6b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "English"}
+{"model": "Deci/DeciLM-7B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "English"}
 // multiple (ch-jp)/en bi/multi lingual models
+{"model": "internlm/internlm2-7b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "?"}
+{"model": "internlm/internlm2-base-7b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "internlm/internlm-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "internlm/internlm2-20b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "?"}
+{"model": "internlm/internlm2-base-20b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "internlm/internlm-20b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "Qwen/Qwen-1_8B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "Qwen/Qwen-7B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "Qwen/Qwen-14B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "xverse/XVERSE-7B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "xverse/XVERSE-13B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "xverse/XVERSE-13B-256K", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "Skywork/Skywork-13B-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "baichuan-inc/Baichuan-7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "baichuan-inc/Baichuan-13B-Base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "baichuan-inc/Baichuan2-7B-Base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "baichuan-inc/Baichuan2-13B-Base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "OrionStarAI/Orion-14B-Base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "deepseek-ai/deepseek-llm-7b-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "deepseek-ai/deepseek-moe-16b-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "BAAI/Aquila-7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "BAAI/Aquila2-7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "THUDM/chatglm3-6b-base", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "THUDM/glm-2b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "THUDM/glm-10b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "fnlp/moss-moon-003-base", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "fnlp/moss-base-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
 // multiple chinese/jp large
+{"model": "Qwen/Qwen-72B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Chinese"}
+{"model": "xverse/XVERSE-65B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "xverse/XVERSE-65B-2", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "deepseek-ai/deepseek-llm-67b-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "BAAI/Aquila2-34B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
+{"model": "BAAI/Aquila2-70B-Expr", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "?"}
 // minors must 2
+{"model": "gpt2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "t5-small", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "t5-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "t5-large", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/mt5-small", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/mt5-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/mt5-large", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
 //others
+{"model": "NucleusAI/nucleus-22B-token-500B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-14m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-70m-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-160m-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-410m-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-1b-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-2.8b-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-6.9b-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-12b-deduped", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/gpt-neo-125m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/gpt-neo-1.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/gpt-neo-2.7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/gpt-j-6b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/gpt-neox-20b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/opt-125m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/opt-350m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/opt-1.3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/opt-2.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/opt-6.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/opt-13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/opt-30b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
 //other large
+{"model": "facebook/opt-66b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "tiiuae/falcon-40b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
 // minors portuguese
+{"model": "pierreguillou/gpt2-small-portuguese", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "pucpr/gpt2-bio-pt", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "unicamp-dl/ptt5-small-portuguese-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "unicamp-dl/ptt5-base-portuguese-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "unicamp-dl/ptt5-large-portuguese-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "unicamp-dl/ptt5-small-t5-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "unicamp-dl/ptt5-base-t5-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "unicamp-dl/ptt5-large-t5-vocab", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "josu/gpt-neo-pt-br", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "josu/gpt-neo-pt-1.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "monilouise/opt125M_portuguese", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
+{"model": "HeyLucasLeao/gpt-neo-small-portuguese", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Portuguese"}
 // other langs (es/Ko/Jp/nordic)
+{"model": "projecte-aina/FLOR-760M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Spanish"}
+{"model": "projecte-aina/FLOR-1.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Spanish"}
+{"model": "projecte-aina/FLOR-6.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Spanish"}
+{"model": "projecte-aina/aguila-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Spanish"}
+{"model": "EleutherAI/polyglot-ko-12.8b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Other"}
+{"model": "matsuo-lab/weblab-10b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "Other"}
+{"model": "pfnet/plamo-13b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "AI-Sweden-Models/gpt-sw3-6.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "AI-Sweden-Models/gpt-sw3-6.7b-v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "AI-Sweden-Models/gpt-sw3-20b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "AI-Sweden-Models/gpt-sw3-40b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "OpenLLM-France/Claire-Mistral-7B-0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Other"}
+{"model": "OpenLLM-France/Claire-7B-0.1", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🆎 : language adapted models (FP, FT, ...)", "main_language": "Other"}
 // huge models:
 //{"model": "bigscience/bloom", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 //{"model": "tiiuae/falcon-180B", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 //{"model": "facebook/galactica-120b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained"}
 //random chat models
+{"model": "openchat/openchat-3.5-0106", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "💬 : chat models (RLHF, DPO, IFT, ...)", "main_language": "English"}
 //other 2
+{"model": "stabilityai/stablelm-base-alpha-3b-v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "stabilityai/stablelm-base-alpha-7b-v2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "stabilityai/stablelm-base-alpha-3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "stabilityai/stablelm-base-alpha-7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openai-community/openai-gpt", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openai-community/gpt2-medium", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openai-community/gpt2-large", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "openai-community/gpt2-xl", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "microsoft/phi-1", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "microsoft/phi-1_5", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "microsoft/phi-2", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "mosaicml/mpt-7b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "mosaicml/mpt-30b", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "mosaicml/mpt-7b-8k", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "01-ai/Yi-6B-200K", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "01-ai/Yi-34B-200K", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/t5-v1_1-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/t5-v1_1-small", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/t5-v1_1-large", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/t5-v1_1-xl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/t5-v1_1-xxl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/mt5-xl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/mt5-xxl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/umt5-small", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/umt5-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/umt5-xl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "google/umt5-xxl", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "AdaptLLM/law-LLM", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "English"}
+{"model": "AdaptLLM/medicine-LLM", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "English"}
+{"model": "AdaptLLM/finance-LLM", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "English"}
+{"model": "AdaptLLM/law-LLM-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "English"}
+{"model": "AdaptLLM/medicine-LLM-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "English"}
+{"model": "AdaptLLM/finance-LLM-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🔶 : fine-tuned", "main_language": "English"}
+{"model": "cerebras/Cerebras-GPT-111M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "cerebras/Cerebras-GPT-256M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "cerebras/Cerebras-GPT-590M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "cerebras/Cerebras-GPT-1.3B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "cerebras/Cerebras-GPT-2.7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "cerebras/Cerebras-GPT-6.7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "cerebras/Cerebras-GPT-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "cerebras/btlm-3b-8k-base", "base_model": "", "revision": "main", "precision": "bfloat16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "ai-forever/mGPT-13B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "ai-forever/mGPT", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-70m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-160m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-410m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-1b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-2.8b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-6.9b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "EleutherAI/pythia-12b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/galactica-125m", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/galactica-1.3b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/galactica-6.7b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/galactica-30b", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/xglm-564M", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/xglm-1.7B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/xglm-2.9B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/xglm-4.5B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}
+{"model": "facebook/xglm-7.5B", "base_model": "", "revision": "main", "precision": "float16", "weight_type": "Original", "model_type": "🟢 : pretrained", "main_language": "English"}

src/display/utils.py CHANGED Viewed

@@ -66,6 +66,7 @@ auto_eval_column_dict.append(["dummy", ColumnContent, ColumnContent("Model Name"
 if GET_ORIGINAL_HF_LEADERBOARD_EVAL_RESULTS:
     auto_eval_column_dict.append(["original_benchmark_average", ColumnContent, ColumnContent("🤗 Leaderboard Average", "number", False)])
 auto_eval_column_dict.append(["npm", ColumnContent, ColumnContent("NPM (Average) ⬆️", "number", False)])
 # We use make dataclass to dynamically fill the scores from Tasks
 AutoEvalColumn = make_dataclass("AutoEvalColumn", auto_eval_column_dict, frozen=True)
@@ -103,7 +104,8 @@ baseline_row = {
     AutoEvalColumn.license.name: "",
     AutoEvalColumn.still_on_hub.name: False,
     AutoEvalColumn.moe.name: False,
-    AutoEvalColumn.eval_time.name: 0.0
 }
 baseline_list = []
@@ -152,6 +154,7 @@ human_baseline_row = {
     AutoEvalColumn.still_on_hub.name: False,
     AutoEvalColumn.moe.name: False,
     AutoEvalColumn.eval_time.name: 0.0,
 }
 baseline_list = []
@@ -225,7 +228,27 @@ class Precision(Enum):
             return Precision.qt_GPTQ
         return Precision.Unknown
 # Column selection

 if GET_ORIGINAL_HF_LEADERBOARD_EVAL_RESULTS:
     auto_eval_column_dict.append(["original_benchmark_average", ColumnContent, ColumnContent("🤗 Leaderboard Average", "number", False)])
 auto_eval_column_dict.append(["npm", ColumnContent, ColumnContent("NPM (Average) ⬆️", "number", False)])
+auto_eval_column_dict.append(["main_language", ColumnContent, ColumnContent("Main Language", "str", False)])
 # We use make dataclass to dynamically fill the scores from Tasks
 AutoEvalColumn = make_dataclass("AutoEvalColumn", auto_eval_column_dict, frozen=True)
     AutoEvalColumn.license.name: "",
     AutoEvalColumn.still_on_hub.name: False,
     AutoEvalColumn.moe.name: False,
+    AutoEvalColumn.eval_time.name: 0.0,
+    AutoEvalColumn.main_language.name: "?"
 }
 baseline_list = []
     AutoEvalColumn.still_on_hub.name: False,
     AutoEvalColumn.moe.name: False,
     AutoEvalColumn.eval_time.name: 0.0,
+    AutoEvalColumn.main_language.name: "?",
 }
 baseline_list = []
             return Precision.qt_GPTQ
         return Precision.Unknown
+class Language(Enum):
+    English = ModelDetails("English")
+    Portuguese = ModelDetails("Portuguese")
+    Spanish = ModelDetails("Spanish")
+    Chinese = ModelDetails("Chinese")
+    Other = ModelDetails("Other")
+    Unknown = ModelDetails("?")
+    def from_str(language):
+        language = language.lower().replace('-', '').replace('_', '')
+        if language in ["pt", "ptpt", "ptbr", "portuguese"]:
+            return Language.Portuguese
+        if language in ["en", "enus", "engb", "english", ]:
+            return Language.English
+        if language in ["es", "spanish"]:
+            return Language.Spanish
+        if language in ["zh", "chinese"]:
+            return Language.Chinese
+        if language in ["other", "multi", "multilingual"]:
+            return Language.Other
+        return Language.Unknown
 # Column selection

src/leaderboard/read_evals.py CHANGED Viewed

@@ -4,6 +4,7 @@ import math
 import os
 from dataclasses import dataclass
 from typing import List
 import dateutil
 import numpy as np
@@ -11,7 +12,7 @@ import numpy as np
 from huggingface_hub import ModelCard
 from src.display.formatting import make_clickable_model
-from src.display.utils import AutoEvalColumn, ModelType, Tasks, Precision, WeightType, ORIGINAL_TASKS
 from src.envs import GET_ORIGINAL_HF_LEADERBOARD_EVAL_RESULTS, SHOW_INCOMPLETE_EVALS
 @dataclass
@@ -26,6 +27,7 @@ class EvalResult:
     precision: Precision = Precision.Unknown
     model_type: ModelType = ModelType.Unknown # Pretrained, fine tuned, ...
     weight_type: WeightType = WeightType.Original # Original or Adapter
     architecture: str = "Unknown" # From config file
     license: str = "?"
     likes: int = 0
@@ -137,6 +139,7 @@ class EvalResult:
             self.architecture = request.get("architectures", "Unknown")
             self.status = request.get("status", "FAILED")
             self.hidden = request.get("hidden", False)
         except Exception as e:
             self.status = "FAILED"
             print(f"Could not find request file for {self.org}/{self.model}")
@@ -188,7 +191,8 @@ class EvalResult:
             AutoEvalColumn.moe.name: ("moe" in self.tags if self.tags else False) or "moe" in self.full_model.lower(),
             AutoEvalColumn.flagged.name: self.flagged,
             AutoEvalColumn.eval_time.name: self.eval_time,
-            AutoEvalColumn.npm.name: npm
         }
         for task in Tasks:

 import os
 from dataclasses import dataclass
 from typing import List
+import traceback
 import dateutil
 import numpy as np
 from huggingface_hub import ModelCard
 from src.display.formatting import make_clickable_model
+from src.display.utils import AutoEvalColumn, ModelType, Tasks, Precision, Language, WeightType, ORIGINAL_TASKS
 from src.envs import GET_ORIGINAL_HF_LEADERBOARD_EVAL_RESULTS, SHOW_INCOMPLETE_EVALS
 @dataclass
     precision: Precision = Precision.Unknown
     model_type: ModelType = ModelType.Unknown # Pretrained, fine tuned, ...
     weight_type: WeightType = WeightType.Original # Original or Adapter
+    main_language: Language = Language.Unknown
     architecture: str = "Unknown" # From config file
     license: str = "?"
     likes: int = 0
             self.architecture = request.get("architectures", "Unknown")
             self.status = request.get("status", "FAILED")
             self.hidden = request.get("hidden", False)
+            self.main_language = request.get("main_language", "?")
         except Exception as e:
             self.status = "FAILED"
             print(f"Could not find request file for {self.org}/{self.model}")
             AutoEvalColumn.moe.name: ("moe" in self.tags if self.tags else False) or "moe" in self.full_model.lower(),
             AutoEvalColumn.flagged.name: self.flagged,
             AutoEvalColumn.eval_time.name: self.eval_time,
+            AutoEvalColumn.npm.name: npm,
+            AutoEvalColumn.main_language.name: self.main_language
         }
         for task in Tasks:

src/submission/submit.py CHANGED Viewed

@@ -27,7 +27,8 @@ def add_new_eval(
     private: bool,
     weight_type: str,
     model_type: str,
-    source="leaderboard"
 ):
     global REQUESTED_MODELS
     global USERS_TO_SUBMISSION_DATES
@@ -119,6 +120,7 @@ def add_new_eval(
         "params": model_size,
         "architectures": architecture,
         "weight_type": weight_type,
         "status": "PENDING",
         "submitted_time": current_time,
         "model_type": model_type,

     private: bool,
     weight_type: str,
     model_type: str,
+    main_language: str,
+    source="leaderboard",
 ):
     global REQUESTED_MODELS
     global USERS_TO_SUBMISSION_DATES
         "params": model_size,
         "architectures": architecture,
         "weight_type": weight_type,
+        "main_language": main_language,
         "status": "PENDING",
         "submitted_time": current_time,
         "model_type": model_type,