У Мінцифри повідомили, коли запрацює національна ШІ-інфраструктура
Фото: Unsplash
В Україні у 2026 році з'явиться власна велика мовна модель, яка запустить "бум" ШІ-чатів та асистентів для держсервісів і бізнесів. Про це повідомляє пресслужба Мінцифри.
Технічним партнером у розбудову національної ШІ-інфраструктури став "Київстар", який фінансує та веде розробку, а після закінчення — передасть мовну модель державі.
Фундаментом для неї обрали сімейство моделей Gemma від Google — технології адаптують під українську мову та контекст. Наразі триває підготовка даних, що потребує не лише інформації з інтернету, а й глибоких знань з історичних архівів та інших письмових джерел.
Інформацію для навчання збирають у державних інституціях, медіа, університетах та наукових закладах. А для незалежного контролю розробки моделі зібрали комітет експертів, які працюють за чотирма напрямами: науково-технічним, правовим, культурно-історичним та мовним.
Їхнім завданням є розробка професійних бенчмарків (системи тестування), аби переконатися, що модель якісно навчена. Вже у січні цього року з'являться:
- перша база текстів для тренування мовної моделі;
- покращений токенізатор — інструмент, який ефективно розбиває слова на елементи;
- власні бенчмарки для оцінки якості — стандарти, за якими перевірятимуть ефективність та безпеку LLM.
Також у січні в "Дії" запустять голосування, аби обрати назву української LLM. Паралельно триває створення юридичних правил, щоб робота з даними для моделі була прозорою, безпечною та відповідала вимогам у сфері інтелектуальної власності.
Таким чином першу версію моделі запустять в бета-тестування вже цією весною — вона буде навчена на унікальних даних і зможе конкурувати з іншими моделями у відкритих рейтингах.