Дек. 24

Запустили відкритий лідерборд для порівняння роботи LLM з українською мовою

В Україні з’явився відкритий лідерборд для порівняння великих мовних моделей за якістю роботи з українською мовою.

Його запустили розробники Lapa LLM у співпраці з командою MamayLM на базі бенчмарків, які використовували під час розробки. Про це повідомив один з розробників моделі Lapa LLM, аспірант УКУ, Юрій Панів.

Лідерборд показує, як різні LLM справляються з типовими завданнями українською: перекладом, стислим переказом, запитаннями-відповідями, логічними тестами, знаннями та математичними задачами. Дані відкриті — доступні не лише результати, а й код для відтворення тестів локально. На зараз лідерборд включає версії Lapa LLM, MamayLM, Qwen та Gemma.

У команді кажуть, що лідерборд планують розширювати. Серед наступних кроків — публікація повних логів бенчмарків, додавання оцінки візуальних задач, перевірка етичного елайнменту моделей, порівняння ефективності токенізаторів і відображення кількості параметрів. Також у планах — додати моделі, доступні через API, зокрема від OpenAI, Anthropic та Google, а також оцінювання квантованих версій LLM.

Сам лідерборд доступний на Hugging Face, а репозиторій з кодом — на GitHub. Користувачі можуть сортувати моделі за метриками, порівнювати їх між собою, будувати графіки й запускати ті самі тести у себе. Команда закликає розробників і дослідників залишати фідбек та пропозиції.

Розробники зазначають, що мета проєкту — поступово сформувати спільну, прозору основу для оцінки LLM з фокусом на українську мову.

Похожие статьи:

Tele2 начинает принимать заказы на номера в Москве

Оператор Tele2 объявил о старте предзаказа SIM-карт в Интернет-магазине Московского региона. На сайте компании жители столичного региона...

Захищаючи Україну, загинув розробник із ELEKS Борис Латик

На фронті загинув Junior Software Developer із ELEKS Борис Латик. Він пішов на війну добровольцем. Сьогодні, 11 серпня, рідні і близькі...

Онлайн vs Офлайн. На зорі освітньої революції

cjmacer / Shutterstock.com[Про автора: Яків Крамаренко — CEO в Automician, тренер і автор ІТ-курсів з 8-річним досвідом в ІТ, з основним...

Melexis запускає магістерську програму в КПІ. Що вивчатимуть

Бельгійська IT-компанія Melexis запустила освітню програму для магістрів на базі КПІ ім. Сікорського. У компанії для DOU...

МОН створює мережу стартап-шкіл на базі університетів та наукових установ

Створення стартап-шкіл — інкубаторів-акселераторів — експериментальний проєкт від МОН. Його мета — посилити...