open_cn_llm_leaderboard

Running on CPU Upgrade

Clémentine commited on Nov 14, 2023

Commit

bb17be3

1 Parent(s): ae85651

Fix TruthfulQA NaN scores to 0

Files changed (1) hide show

src/leaderboard/read_evals.py CHANGED Viewed

@@ -73,8 +73,8 @@ class EvalResult:
                 continue
             # Some truthfulQA values are NaNs
-            if task.benchmark == "truthfulqa:mc" and task.benchmark in data["results"]:
-                if math.isnan(float(data["results"][task.benchmark][task.metric])):
                     results[task.benchmark] = 0.0
                     continue

                 continue
             # Some truthfulQA values are NaNs
+            if task.benchmark == "truthfulqa:mc" and 'harness|truthfulqa:mc|0' in data["results"]:
+                if math.isnan(float(data["results"]['harness|truthfulqa:mc|0'][task.metric])):
                     results[task.benchmark] = 0.0
                     continue