Създаден в партньорство с престижния ETH – Цюрих, MamayLM съдържа 9 милиарда параметъра и може да работи ефективно само на един графичен процесор (GPU). Въпреки своята „лека“ структура, моделът демонстрира висока производителност както на украински, така и на английски език, надминавайки значително други модели от същия клас и конкурирайки далеч по-големи системи.
MamayLM е разработен изцяло с дарения и ще бъде свободно достъпен за украински институции, организации и граждани. Една от основните му цели е да подпомогне държавните структури, като им осигури локална обработка на данни и повишена сигурност, без нужда от външни сървъри.
Моделът е базиран върху отворения модел Gemma-2-9B на Google, както и някои от компонентите на BgGPT 2.0 – българския езиков модел, представен от INSAIT в края на 2024 г.
„Съчетахме натрупания опит от работата по BgGPT с редица подобрения, за да създадем ефективен и надежден модел на украински. MamayLM е мощен инструмент за генериране, анализ и разбиране на текст“, посочват от INSAIT.
С това България става единствената държава в Европа, която не само разполага със собствен езиков модел на националния си език, но и създава високопроизводителни AI решения за чужди държави. Институтът вече работи и по нови генеративни AI проекти и езикови модели за други езици, с амбицията да превърне страната ни в регионален хъб за изкуствен интелект.