Grammarly випустила другу версію GEC-корпусу української мови

Grammarly опублікувала у вільному доступі UA-GEC 2.0 — другу версію свого анотованого GEC-корпусу української мови (GEC — grammatical error correction), яка містить майже 34 000 речень.

Команда компанії запустила волонтерський проєкт зі створення цього набору даних у серпні 2020 року. Перша версія корпусу UA-GEC із близько 20 000 речень з’явилася у відкритому доступі у січні 2021 року. Відтоді у компанії працювали над розширенням та покращенням корпусу.

Похожие статьи:
Я вже 10 років розвиваю проєкти, команди та комунікацію в аутсорсингових і продуктових компаніях на позиції СОО. А останні кілька...
У разных людей разные ожидания от внедрения автоматизации. Часто бывает, что по прошествии некоторого времени изначальные...
Друзі, цього року ми відзначаємо День програміста 7 січня — разом з усім світом. Вітаємо вас! Для розваги можна розповісти...
Днями ми зібрались на YouTube-каналі DOU і поговорили про Front-end з Андрієм Лісточкіним, Юрієм Артюхом та Юрою Федоренком....
Материал создан в соавторстве с Александром Макеевым, Machine Learning Engineer в R&D MEGOGO Мы начинаем серию статей о том, как...

Яндекс.Метрика