Spaces:

Intel
/

low_bit_open_llm_leaderboard

Running

n1ck-guo commited on Oct 9, 2024

Commit

d56aebd

1 Parent(s): 08450d6

support for autoround type

Signed-off-by: n1ck-guo <heng.guo@intel.com>

Files changed (2) hide show

src/leaderboard/read_evals.py CHANGED Viewed

@@ -2,6 +2,7 @@ import glob
 import json
 import math
 import os
 from dataclasses import dataclass
 import dateutil
@@ -145,6 +146,7 @@ class EvalResult:
         except Exception as e:
             self.status = "Failed"
             print(f"Could not find request file for {self.org}/{self.model}")
     def update_with_dynamic_file_dict(self, file_dict):
         self.license = file_dict.get("license", "?")

 import json
 import math
 import os
+import traceback
 from dataclasses import dataclass
 import dateutil
         except Exception as e:
             self.status = "Failed"
             print(f"Could not find request file for {self.org}/{self.model}")
+            print(traceback.format_exc())
     def update_with_dynamic_file_dict(self, file_dict):
         self.license = file_dict.get("license", "?")

src/submission/submit.py CHANGED Viewed

@@ -148,6 +148,10 @@ def add_new_eval(
             in_group_size = quantization_config.get('in_group_size')
             bits = int(nbits_per_codebook * num_codebooks / in_group_size)
             precision = f"{bits}bit"
     if precision == "4bit":
         weight_dtype = "int4"

             in_group_size = quantization_config.get('in_group_size')
             bits = int(nbits_per_codebook * num_codebooks / in_group_size)
             precision = f"{bits}bit"
+        if "auto-round" in quant_method:
+            hardware = "gpu"
+            quant_type = "AutoRound"
+            precision = f"{quantization_config.get('bits', '4bit')}bit"
     if precision == "4bit":
         weight_dtype = "int4"