Апр. 11

Укрдержархів вперше передасть 10 ТБ даних для тренування національної LLM «Сяйво»

Державна архівна служба України вперше передасть свої дані для тренування національної мовної моделі «Сяйво».

Йдеться про 10 терабайтів унікальних історичних матеріалів, державних документів і наукових текстів. Про це повідомили в Мінцифри.

Такий масив даних дорівнює 70 000 книжок. У міністерстві пояснили, що тренування LLM на україномовних джерелах дозволить моделі краще розуміти український контекст. На сьогодні більшість великих ШІ-помічників працюють переважно на англомовних даних, а українською часто просто перекладають відповіді.

Голова Укрдержархіву Анатолій Хромов заявив, що передані дані містять великий масив матеріалів різних історичних епох — друкованих і рукописних, українською та іншими мовами. За його словами, до кінця 2026 року кількість цифрових копій у держархівах має зрости зі 150 млн до понад 200 млн.

У Мінцифри кажуть, що створення великої мовної моделі є частиною ширшого проєкту з побудови ШІ-суверенітету. Зараз для цього збирають якісний масив даних. За даними відомства, свої матеріали вже надали понад 50 медіа, університетів та бібліотек.

Похожие статьи:

Junior дайджест: курси, стажування, інтернатура. Березень’16
До вашої уваги дайджест навчальних програм для тих, хто починає свою кар’єру в ІТ. В цьому номері зібрані можливості, актуальні...

Видео на канале: Обзор Elephone M2, Asus Zenfone 2 и Selfie, а также аудиосистемы Bowers&Wilkins Zeppelin Wireless
На нашем YouTube канале появились новые видеоролики.Обзор Elephone M2:Обзор Asus Zenfone 2 и Asus Zenfone Selfie:Обзор аудиосистемы Bowers&Wilkins Zeppelin...

Information Security дайджест #13: Лллакинамбур
Дайджест создан в соавторстве с Егором Папышевым. 00h > Интро Закончились новогодние праздники. Салаты и прошлогодний...

Харківський воєнком анонсував повістки у "Дії". У Мінцифри це спростували
Після публічної заяви голови обласного Харківського територіального центру комплектування Володимира Арапа, керівник...

IT і закон: які ключові для індустрії рішення ухвалили у 2022 році
Воєнний 2022 рік відзначився законами та постановами, що торкаються IT-галузі: Дія City, е-резидентство, обіг криптовалют...