evalita_llm_leaderboard

Running

App Files Files Community

rzanoli commited on Mar 27

Commit

ea6af72

1 Parent(s): 5a8f6c4

Small changes

Browse files

Files changed (3) hide show

app.py +29 -1
src/display/css_html_js.py +1 -0
src/display/utils.py +4 -15

app.py CHANGED Viewed

@@ -11,7 +11,6 @@ from src.envs import API, EVAL_REQUESTS_PATH, EVAL_RESULTS_PATH, QUEUE_REPO, REP
 from src.populate import get_evaluation_queue_df, get_leaderboard_df
 from src.submission.submit import add_new_eval
 # Define task metadata (icons, names, descriptions)
 TASK_METADATA = {
     "TE": {"icon": "📊", "name": "Textual Entailment", "tooltip": ""},
@@ -30,6 +29,33 @@ def restart_space():
     """Restart the Hugging Face space."""
     API.restart_space(repo_id=REPO_ID)
 # Helper function for leaderboard initialization
 def init_leaderboard(dataframe, default_selection=None, hidden_columns=None):
     """Initialize and return a leaderboard."""
@@ -53,6 +79,7 @@ def init_leaderboard(dataframe, default_selection=None, hidden_columns=None):
         bool_checkboxgroup_label="Hide models",
         interactive=False,
     )
 def download_snapshot(repo, local_dir):
@@ -80,6 +107,7 @@ with demo:
     gr.Markdown(INTRODUCTION_TEXT, elem_classes="markdown-text")
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         # Main leaderboard tab
         with gr.TabItem("🏅 EVALITA-LLM Benchmark"):

 from src.populate import get_evaluation_queue_df, get_leaderboard_df
 from src.submission.submit import add_new_eval
 # Define task metadata (icons, names, descriptions)
 TASK_METADATA = {
     "TE": {"icon": "📊", "name": "Textual Entailment", "tooltip": ""},
     """Restart the Hugging Face space."""
     API.restart_space(repo_id=REPO_ID)
+def init_leaderboard(dataframe, default_selection=None, hidden_columns=None):
+    """Initialize and return a leaderboard."""
+    if dataframe is None or dataframe.empty:
+        raise ValueError("Leaderboard DataFrame is empty or None.")
+    field_list = fields(AutoEvalColumn)
+    return Leaderboard(
+        value=dataframe,
+        datatype=[c.type for c in field_list],
+        select_columns=SelectColumns(
+            default_selection=default_selection or [c.name for c in field_list if c.displayed_by_default],
+            cant_deselect=[c.name for c in field_list if c.never_hidden],
+            label="Select Columns to Display:",
+        ),
+        search_columns=[AutoEvalColumn.model.name, AutoEvalColumn.license.name],
+        hide_columns=hidden_columns or [c.name for c in field_list if c.hidden],
+        filter_columns=[
+            ColumnFilter(AutoEvalColumn.fewshot_type.name, type="checkboxgroup", label="N-Few-Shot Learning (FS)"),
+            ColumnFilter(AutoEvalColumn.params.name, type="slider", min=0, max=150, label="Select the number of parameters (B)"),
+        ],
+        bool_checkboxgroup_label="Hide models",
+        interactive=False,
+    )
+'''
 # Helper function for leaderboard initialization
 def init_leaderboard(dataframe, default_selection=None, hidden_columns=None):
     """Initialize and return a leaderboard."""
         bool_checkboxgroup_label="Hide models",
         interactive=False,
     )
+'''
 def download_snapshot(repo, local_dir):
     gr.Markdown(INTRODUCTION_TEXT, elem_classes="markdown-text")
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         # Main leaderboard tab
         with gr.TabItem("🏅 EVALITA-LLM Benchmark"):

src/display/css_html_js.py CHANGED Viewed

@@ -94,6 +94,7 @@ custom_css = """
 #box-filter > .form{
     border: 0
 }
 """
 get_window_url_params = """

 #box-filter > .form{
     border: 0
 }
 """
 get_window_url_params = """

src/display/utils.py CHANGED Viewed

@@ -89,8 +89,6 @@ class ModelType(Enum):
             return ModelType.IFT
         return ModelType.Unknown
 @dataclass
 class FewShotDetails:
     name: str
@@ -113,10 +111,6 @@ class FewShotType(Enum):
             return FewShotType.FS
         return FewShotType.Unknown
 class WeightType(Enum):
     Adapter = ModelDetails("Adapter")
     Original = ModelDetails("Original")
@@ -142,9 +136,7 @@ EVAL_TYPES = [c.type for c in fields(EvalQueueColumn)]
 BENCHMARK_COLS = [t.value.col_name for t in Tasks]
-# Roberto
 # Nuovi valori per CPS, AVERAGE, BEST, e ID nella tabella
 @dataclass
 class NewColumnContent:
@@ -153,18 +145,15 @@ class NewColumnContent:
     displayed_by_default: bool
     hidden: bool = False
     never_hidden: bool = False
-# Inizializza i nuovi valori
 new_column_dict = []
 # Aggiungi CPS, VERAGE, BEST, ID
 new_column_dict.append(["CPS", NewColumnContent, NewColumnContent("CPS", "number", True)])
 new_column_dict.append(["AVERAGE", NewColumnContent, NewColumnContent("Average ⬆️", "number", True)])
 new_column_dict.append(["BEST", NewColumnContent, NewColumnContent("Best Performance", "number", True)])
 new_column_dict.append(["ID", NewColumnContent, NewColumnContent("ID", "str", True)])
-# Puoi usare make_dataclass per creare la classe dinamicamente come per AutoEvalColumn
 NewColumn = make_dataclass("NewColumn", new_column_dict, frozen=True)
-# Includi questi nuovi valori nei COLS o in altre variabili di configurazione, se necessario
 NEW_COLS = [c.name for c in fields(NewColumn) if not c.hidden]

             return ModelType.IFT
         return ModelType.Unknown
 @dataclass
 class FewShotDetails:
     name: str
             return FewShotType.FS
         return FewShotType.Unknown
 class WeightType(Enum):
     Adapter = ModelDetails("Adapter")
     Original = ModelDetails("Original")
 BENCHMARK_COLS = [t.value.col_name for t in Tasks]
+'''
 # Nuovi valori per CPS, AVERAGE, BEST, e ID nella tabella
 @dataclass
 class NewColumnContent:
     displayed_by_default: bool
     hidden: bool = False
     never_hidden: bool = False
+'''
+'''
 new_column_dict = []
 # Aggiungi CPS, VERAGE, BEST, ID
 new_column_dict.append(["CPS", NewColumnContent, NewColumnContent("CPS", "number", True)])
 new_column_dict.append(["AVERAGE", NewColumnContent, NewColumnContent("Average ⬆️", "number", True)])
 new_column_dict.append(["BEST", NewColumnContent, NewColumnContent("Best Performance", "number", True)])
 new_column_dict.append(["ID", NewColumnContent, NewColumnContent("ID", "str", True)])
 NewColumn = make_dataclass("NewColumn", new_column_dict, frozen=True)
 NEW_COLS = [c.name for c in fields(NewColumn) if not c.hidden]
+'''