Spaces:

gaia-benchmark
/

leaderboard

Running on CPU Upgrade

App Files Files Community

clefourrier HF Staff commited on May 28

Commit

d34b929

verified ·

1 Parent(s): 08703b5

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -7

app.py CHANGED Viewed

@@ -59,7 +59,7 @@ def get_dataframe_from_results(eval_results, split):
     return df
-eval_dataframe_val = get_dataframe_from_results(eval_results=eval_results, split="validation")
 eval_dataframe_test = get_dataframe_from_results(eval_results=eval_results, split="test")
 # Gold answers
@@ -74,7 +74,7 @@ def restart_space():
 TYPES = ["markdown", "number", "number", "number", "number", "str", "str", "str"]
 def add_new_eval(
-    val_or_test: str,
     model: str,
     model_family: str,
     system_prompt: str,
@@ -84,6 +84,7 @@ def add_new_eval(
     mail: str,
     profile: gr.OAuthProfile,
 ):
     try:
         # Was the profile created less than 2 month ago?
         user_data = requests.get(f"https://huggingface.co/api/users/{profile.username}/overview")
@@ -250,9 +251,9 @@ def add_new_eval(
 def refresh():
     eval_results = load_dataset(RESULTS_DATASET, YEAR_VERSION, token=TOKEN, download_mode="force_redownload", verification_mode=VerificationMode.NO_CHECKS,trust_remote_code=True)
-    eval_dataframe_val = get_dataframe_from_results(eval_results=eval_results, split="validation")
     eval_dataframe_test = get_dataframe_from_results(eval_results=eval_results, split="test")
-    return eval_dataframe_val, eval_dataframe_test
 def upload_file(files):
     file_paths = [file.name for file in files]
@@ -288,7 +289,7 @@ with demo:
         refresh,
         inputs=[],
         outputs=[
-            leaderboard_table_val,
             leaderboard_table_test,
         ],
     )
@@ -297,7 +298,7 @@ with demo:
             gr.Markdown(SUBMISSION_TEXT, elem_classes="markdown-text")
         with gr.Row():
             with gr.Column():
-                level_of_test = gr.Radio(["test"], value="test", label="Split")
                 model_name_textbox = gr.Textbox(label="Agent name")
                 model_family_textbox = gr.Textbox(label="Model family")
                 system_prompt_textbox = gr.Textbox(label="System prompt example")
@@ -315,7 +316,7 @@ with demo:
         submit_button.click(
             add_new_eval,
             [
-                level_of_test,
                 model_name_textbox,
                 model_family_textbox,
                 system_prompt_textbox,

     return df
+#eval_dataframe_val = get_dataframe_from_results(eval_results=eval_results, split="validation")
 eval_dataframe_test = get_dataframe_from_results(eval_results=eval_results, split="test")
 # Gold answers
 TYPES = ["markdown", "number", "number", "number", "number", "str", "str", "str"]
 def add_new_eval(
+    #val_or_test: str,
     model: str,
     model_family: str,
     system_prompt: str,
     mail: str,
     profile: gr.OAuthProfile,
 ):
+    val_or_test = "test"
     try:
         # Was the profile created less than 2 month ago?
         user_data = requests.get(f"https://huggingface.co/api/users/{profile.username}/overview")
 def refresh():
     eval_results = load_dataset(RESULTS_DATASET, YEAR_VERSION, token=TOKEN, download_mode="force_redownload", verification_mode=VerificationMode.NO_CHECKS,trust_remote_code=True)
+    #eval_dataframe_val = get_dataframe_from_results(eval_results=eval_results, split="validation")
     eval_dataframe_test = get_dataframe_from_results(eval_results=eval_results, split="test")
+    return eval_dataframe_test
 def upload_file(files):
     file_paths = [file.name for file in files]
         refresh,
         inputs=[],
         outputs=[
+            #leaderboard_table_val,
             leaderboard_table_test,
         ],
     )
             gr.Markdown(SUBMISSION_TEXT, elem_classes="markdown-text")
         with gr.Row():
             with gr.Column():
+                #level_of_test = gr.Radio(["test"], value="test", label="Split")
                 model_name_textbox = gr.Textbox(label="Agent name")
                 model_family_textbox = gr.Textbox(label="Model family")
                 system_prompt_textbox = gr.Textbox(label="System prompt example")
         submit_button.click(
             add_new_eval,
             [
+                #level_of_test,
                 model_name_textbox,
                 model_family_textbox,
                 system_prompt_textbox,