Сент. 02

Який ШІ найбільш проукраїнський: дослідники опитали LLM у різних країнах

Texty.org.ua разом з OpenBabylon перевірили 27 відкритих мовних моделей і з’ясували, що вони по-різному сприймають та відображають Україну.

Дослідники поставили мовним моделям 2803 запитання про Україну та перевірили їхні відповіді на упередженість. Для оцінки кожне питання мало чотири варіанти — від проукраїнського до проросійського.

Як проводили дослідження

У фокусі були саме LLM — базові алгоритми, що генерують текст, а не чатботи на їх основі.

«Мовна модель — це базова технологія, алгоритм штучного інтелекту, що здатний генерувати текст у відповідь на запит. Такі моделі лежать в основі чатботів, по суті, це їхній мозок. Тоді як ШІ-чатбот — це застосунок або інтерфейс, що використовує таку модель, але також має додаткові обмеження, фільтри, інструкції, поведінкові установки та інші налаштування», — пояснив співзасновник видання Texty Роман Кульчинський.

До дослідження увійшли моделі від Microsoft, Google, DeepSeek, Cohere, Alibaba Cloud, Mistral і Meta. Окремо перевірили MamayLM — адаптовану під український контекст версію моделі Google Gemma, створену в інституті INSAIT.

Дружні та упереджені LLM

Моделі по-різному трактують Україну: одні прямо називають росію агресором і визнають Крим українським, інші уникають відповіді чи повторюють російські тези. Найбільш упереджена модель поширювала дезінформацію у третині відповідей. Найчастіше викривлення з’являлися на темах історії, геополітики та ідентичності.

У «рейтингу дружності до України» канадські моделі показали найкращий результат — 30,8% проукраїнських відповідей. Далі йдуть французькі (26,7%) та американські (25,4%). А от китайські дали лише 22,1% проукраїнських відповідей, тоді як 19,7% були проросійськими.

Найбільше проукраїнських відповідей дали моделі серії Phi від Microsoft та aya-vision-32b від Cohere — у середньому 38–40%.

Аналіз майже 3 тисяч запитань показав, що домінує так звана «західна нейтральність». Вона найчастіше проявляється у темах про антикорупцію (52% відповідей), ідеологію (50%) та державне управління (46%).

Мовні моделі та російська пропаганда

Російські пропагандистські тези найбільше з’являлися у відповідях про історію (27%), геополітику (24%) та національну ідентичність (23%). Саме ці сфери традиційно є мішенню дезінформаційних кампаній.

Моделі також часто «губилися», даючи поверхові чи нерелевантні відповіді — найбільше на темах геополітики (13%) та безпеки (11%).

У багатьох випадках LLM-моделі повторювали ключові тези російської пропаганди:

«Україна — зона інтересів росії, а війна — наслідок експансії НАТО»;
«Східні регіони України тяжіють до росії, тоді як Захід — до ЄС»;
«Русифікація мала позитивний вплив»;
«Сучасна політика України утискає російську меншину»;
«Українське православ’я невіддільне від російських традицій»;
«Україна не здатна збудувати сталу демократію».

Автори звіту вважають, що це можна виправити, якщо стежити за роботою мовних моделей і оновлювати дані для навчання.

Похожие статьи:

Junior дайджест: курси, стажування, вакансії. Березень’18

До вашої уваги дайджест навчальних програм для тих, хто починає свою кар’єру в ІТ. У цьому номері зібрані можливості, актуальні...

Энциклопедия увольнений: 8 неочевидных причин ухода программистов

Я Валерия Козлова, автор технологии EQ Boost, преподаватель LvBS и основатель компании Corporate EQ. В своей работе мне часто приходится...

Нові податки для ФОП | Roblox заблокували в росії | Netflix купує Warner Bros. — DOU News #227

У свіжому дайджесті DOU News говоримо про майже рекордний IT-експорт України, зміни податків для ФОП і те, яку ШІ-модель обрали для...

Pipo U8T – первый планшет с Windows 10 Mobile не на чипсете от Qualcomm

Устройства с ОС Windows Phone прочно ассоциируются с платформами от Qualcomm – до сих пор ни один аппарат с этой ОС не был выпущен с...

У 2024 році зареєстрували понад 148 тисяч нових ФОПів. ІТ — серед найпопулярніших напрямів

За перше півріччя 2024 року українці відкрили понад 148 тисяч ФОПів, що на 10,8% більше, ніж за аналогічний період 2023 року....