Grammarly випустила другу версію GEC-корпусу української мови

Grammarly опублікувала у вільному доступі UA-GEC 2.0 — другу версію свого анотованого GEC-корпусу української мови (GEC — grammatical error correction), яка містить майже 34 000 речень.

Команда компанії запустила волонтерський проєкт зі створення цього набору даних у серпні 2020 року. Перша версія корпусу UA-GEC із близько 20 000 речень з’явилася у відкритому доступі у січні 2021 року. Відтоді у компанії працювали над розширенням та покращенням корпусу.

Похожие статьи:
За даними опитування DOU, фахівці ІТ-сфери активно користуються реферальними програмами: 26,5% шукачів знаходять роботу завдяки...
З початку повномасштабного вторгення росії в Україну ми висвітлюємо, як реагує, допомагає та працює ІТ-індустрія. У новому...
В рубрике DOU Проектор все желающие могут презентовать свой продукт (как стартап, так и ламповый pet-проект). Если вам есть о чем...
З 1 січня 2023 року ІТ-сектор знову сплачує податок на додану вартість, від якого його раніше звільнили на 10 років. Видання...
Чи задоволені айтівці своєю зарплатою? Як оцінюють складність пошуку роботи і чи готові зараз змінити компанію?...

Яндекс.Метрика