NorEval Dashboard 🇳🇴

Norwegian language-modeling evaluation with lm-eval-harness using our NorEval benchmark

Task:

Shots:

Prompts:

Normalization:

Metric:

Sampling error

Prompt deviation

Model size:

7B – 14B

Tasks included in aggregation

Norwegian Language Models

Multilingual Language Models