Update README.md
Browse files
README.md
CHANGED
|
@@ -1,12 +1,3 @@
|
|
| 1 |
-
AWQ квантизация модели https://huggingface.co/CohereForAI/c4ai-command-r-08-2024 полученная с помощью https://github.com/casper-hansen/AutoAWQ
|
| 2 |
-
Для калибровки использовались ограничения на 256 пакетов длиной до 256 токенов,
|
| 3 |
-
собранные из решений различных задач на русском и английском языке с помощью GPT4 / GPT4o из датасетов:
|
| 4 |
-
https://huggingface.co/datasets/IlyaGusev/saiga_scored
|
| 5 |
-
https://huggingface.co/datasets/Open-Orca/OpenOrca
|
| 6 |
-
|
| 7 |
-
Валидация модели производилась на обучающей части бенчмарка MERA https://mera.a-ai.ru/ru/leaderboard,
|
| 8 |
-
так для задачи PARus модель набирает 0.92 что эквивалетно например 4bit квантизациям Qwen2-72B и Llama3-70B
|
| 9 |
-
|
| 10 |
---
|
| 11 |
datasets:
|
| 12 |
- IlyaGusev/saiga_scored
|
|
@@ -16,4 +7,14 @@ language:
|
|
| 16 |
- en
|
| 17 |
base_model: CohereForAI/c4ai-command-r-08-2024
|
| 18 |
pipeline_tag: text-generation
|
| 19 |
-
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
---
|
| 2 |
datasets:
|
| 3 |
- IlyaGusev/saiga_scored
|
|
|
|
| 7 |
- en
|
| 8 |
base_model: CohereForAI/c4ai-command-r-08-2024
|
| 9 |
pipeline_tag: text-generation
|
| 10 |
+
---
|
| 11 |
+
|
| 12 |
+
AWQ квантизация модели https://huggingface.co/CohereForAI/c4ai-command-r-08-2024
|
| 13 |
+
полученная с помощью https://github.com/casper-hansen/AutoAWQ
|
| 14 |
+
Для калибровки использовались ограничения на 256 пакетов длиной до 256 токенов,
|
| 15 |
+
собранные из решений различных задач на русском и английском языке с помощью GPT4 / GPT4o из датасетов:
|
| 16 |
+
https://huggingface.co/datasets/IlyaGusev/saiga_scored
|
| 17 |
+
https://huggingface.co/datasets/Open-Orca/OpenOrca
|
| 18 |
+
|
| 19 |
+
Валидация модели производилась на обучающей части бенчмарка MERA https://mera.a-ai.ru/ru/leaderboard,
|
| 20 |
+
так для задачи PARus модель набирает 0.92 что эквивалетно например 4bit квантизациям Qwen2-72B и Llama3-70B
|