Запустили відкритий лідерборд для порівняння роботи LLM з українською мовою

В Україні з’явився відкритий лідерборд для порівняння великих мовних моделей за якістю роботи з українською мовою.

Його запустили розробники Lapa LLM у співпраці з командою MamayLM на базі бенчмарків, які використовували під час розробки. Про це повідомив один з розробників моделі Lapa LLM, аспірант УКУ, Юрій Панів.

Лідерборд показує, як різні LLM справляються з типовими завданнями українською: перекладом, стислим переказом, запитаннями-відповідями, логічними тестами, знаннями та математичними задачами. Дані відкриті — доступні не лише результати, а й код для відтворення тестів локально. На зараз лідерборд включає версії Lapa LLM, MamayLM, Qwen та Gemma.

У команді кажуть, що лідерборд планують розширювати. Серед наступних кроків — публікація повних логів бенчмарків, додавання оцінки візуальних задач, перевірка етичного елайнменту моделей, порівняння ефективності токенізаторів і відображення кількості параметрів. Також у планах — додати моделі, доступні через API, зокрема від OpenAI, Anthropic та Google, а також оцінювання квантованих версій LLM.

Сам лідерборд доступний на Hugging Face, а репозиторій з кодом — на GitHub. Користувачі можуть сортувати моделі за метриками, порівнювати їх між собою, будувати графіки й запускати ті самі тести у себе. Команда закликає розробників і дослідників залишати фідбек та пропозиції.

Розробники зазначають, що мета проєкту — поступово сформувати спільну, прозору основу для оцінки LLM з фокусом на українську мову.

Похожие статьи:
Оператор Tele2 объявил о старте предзаказа SIM-карт в Интернет-магазине Московского региона. На сайте компании жители столичного региона...
На фронті загинув Junior Software Developer із ELEKS Борис Латик. Він пішов на війну добровольцем. Сьогодні, 11 серпня, рідні і близькі...
cjmacer / Shutterstock.com[Про автора: Яків Крамаренко — CEO в Automician, тренер і автор ІТ-курсів з 8-річним досвідом в ІТ, з основним...
Бельгійська IT-компанія Melexis запустила освітню програму для магістрів на базі КПІ ім. Сікорського. У компанії для DOU...
Створення стартап-шкіл — інкубаторів-акселераторів — експериментальний проєкт від МОН. Його мета — посилити...
Яндекс.Метрика