Мінцифри і «Київстар» обрали AI-модель, на якій працюватиме національна LLM

Мінцифри та «Київстар» визначили базову архітектуру, на якій будуватимуть українську велику мовну модель. Для національної LLM обрали Gemma 3 — відкриту модель Google, яку адаптуватимуть під українську мову та локальні завдання.

Про це DOU повідомили в Мінцифри.

Проєкт курує WINWIN AI Center of Excellence. Його керівник Данило Цьвок каже, що вибір робили з огляду на якість роботи Gemma з українськими текстами, можливість контрольованого навчання та мінімізацію лінгвістичних ризиків.

Директор з розробки диджитал-продуктів «Київстар» Михайло Нестор додав, що модель також обрали через баланс продуктивності та вимог до інфраструктури.

«Модель підтримує понад 140 мов, включно з українською, має до 128 тисяч токенів, мультимодальні можливості (робота із зображеннями) та гнучку архітектуру, що дозволяє адаптувати її під різні завдання», — каже Нестор.

Також модель має декілька розмірностей, що дозволяє легше адаптувати її під різні сфери застосування.

Тепер розробники адаптуватимуть під українську мову. Зокрема:

  • покращать токенайзер, щоб оптимізувати обчислювальні витрати і зробити національну LLM більш точною з українськими текстами;
  • додадуть великий корпус україномовних текстів, над якими працюють спеціалісти;
  • створять власні бенчмарки, щоб перевіряти точність.

Зазначимо, що модель Gemma вже використовують україномовні LLM — MamayLM та Lapa LLM.

Похожие статьи:
GlobalLogic, яка входить у трійку найбільших IT-компаній України, відкрила 10 міні-офісів в західних і центральних регіонах....
12 грудня 2023 року хакери атакували ядро мережі «Київстару». Їм це вдалося зробити через злам акаунту одного...
Наука тільки недавно дізналася, що життя після тридцяти не закінчується. Лишилося тільки питання, чи можна...
Щомісяця ми аналізуємо, як змінюється ситуація з ІТ-вакансіями, відгуками та активністю компаній...
Компанія N-iX оголосила про стратегічне партнерство з Cursor — платформою для розробки...
Яндекс.Метрика