CodeReviewBench

Sleeping

App Files Files Community

Alex commited on Jul 2

Commit

9d40219

1 Parent(s): d369cff

error

Browse files

Files changed (1) hide show

app.py +28 -8

app.py CHANGED Viewed

@@ -87,12 +87,9 @@ def _flatten_entry(entry: Dict) -> Dict:
 def _table_data() -> List[List]:
     data = _load_leaderboard()
     if not data:
-        # Return empty list if no data
         return []
-    # Sort descending by pass@1 as requested
     data.sort(key=lambda x: x["llm_pass_1"], reverse=True)
-    # Convert to list of lists for Gradio table
     table_rows = []
     for entry in data:
         row = [
@@ -101,6 +98,21 @@ def _table_data() -> List[List]:
             entry["llm_pass_1"],
             entry["llm_pass_5"],
             entry["llm_pass_10"],
             entry["metrics"]["readability"],
             entry["metrics"]["relevance"],
             entry["metrics"]["explanation_clarity"],
@@ -157,7 +169,7 @@ def submit_model(
             },
         )
     except Exception as e:
-        return _table_data(), f"❌ Submission failed: {e}"
     data = _load_leaderboard()
     # Replace existing model entry if any
@@ -165,7 +177,7 @@ def submit_model(
     data.append(entry.dict())
     _save_leaderboard(data)
-    return _table_data(), "✅ Submission recorded!"
 # --------------- Interface ---------------
@@ -202,11 +214,19 @@ with gr.Blocks(title="CodeReview Leaderboard") as demo:
     # Initialize table data
     initial_data = _table_data()
     leaderboard_df = gr.Dataframe(
-        headers=["Model", "BLEU", "Pass@1", "Pass@5", "Pass@10", "Readability", "Relevance", "Explanation Clarity", "Problem Identification", "Actionability", "Completeness", "Specificity", "Contextual Adequacy", "Consistency", "Brevity"],
         value=initial_data,
-        label="Current Leaderboard",
         interactive=False,
     )
@@ -255,7 +275,7 @@ with gr.Blocks(title="CodeReview Leaderboard") as demo:
                 consistency_inp,
                 brevity_inp,
             ],
-            outputs=[leaderboard_df, status_markdown],
             api_name="submit_model",
         )

 def _table_data() -> List[List]:
     data = _load_leaderboard()
     if not data:
         return []
     data.sort(key=lambda x: x["llm_pass_1"], reverse=True)
     table_rows = []
     for entry in data:
         row = [
             entry["llm_pass_1"],
             entry["llm_pass_5"],
             entry["llm_pass_10"],
+        ]
+        table_rows.append(row)
+    return table_rows
+def _multimetric_table_data() -> List[List]:
+    data = _load_leaderboard()
+    if not data:
+        return []
+    data.sort(key=lambda x: x["llm_pass_1"], reverse=True)
+    table_rows = []
+    for entry in data:
+        row = [
+            entry["model_name"],
             entry["metrics"]["readability"],
             entry["metrics"]["relevance"],
             entry["metrics"]["explanation_clarity"],
             },
         )
     except Exception as e:
+        return _table_data(), _multimetric_table_data(), f"❌ Submission failed: {e}"
     data = _load_leaderboard()
     # Replace existing model entry if any
     data.append(entry.dict())
     _save_leaderboard(data)
+    return _table_data(), _multimetric_table_data(), "✅ Submission recorded!"
 # --------------- Interface ---------------
     # Initialize table data
     initial_data = _table_data()
+    initial_multimetric_data = _multimetric_table_data()
     leaderboard_df = gr.Dataframe(
+        headers=["Model", "BLEU", "Pass@1", "Pass@5", "Pass@10"],
         value=initial_data,
+        label="Main Metrics Leaderboard",
+        interactive=False,
+    )
+    multimetric_df = gr.Dataframe(
+        headers=["Model", "Readability", "Relevance", "Explanation Clarity", "Problem Identification", "Actionability", "Completeness", "Specificity", "Contextual Adequacy", "Consistency", "Brevity"],
+        value=initial_multimetric_data,
+        label="Multi-Metric Scores",
         interactive=False,
     )
                 consistency_inp,
                 brevity_inp,
             ],
+            outputs=[leaderboard_df, multimetric_df, status_markdown],
             api_name="submit_model",
         )