KazLLM мен AlemLLM: отандық тіл моделіне қанша қаржы жұмсалған

Фото: ИИ-мен жасалған, бильд-редактор Ахтам Зиперов

Қазақстан билігі 2026 жылды «жасанды интеллект» жылы деп жариялап, «технологиялық егемендік» ұранымен ұлттық тіл моделін (LLM) таныстыруға көшті. БАӘ, Сауд Арабиясы және Қытай сынды алпауыттардың ізімен жасалған жобаның стратегиялық маңызы зор екені даусыз. Алайда 10 ақпандағы үкімет отырысында Қасым-Жомарт Тоқаев отандық KazLLM бағдарламасына қазақстандықтар сенбей отыр деп мәлімдеді.

Сол жиында Жасанды интеллект және цифрлық даму министрі Жаслан Мәдиев KazLLM мен AlemLLM қырықтан астам жүйеге енгізілген деп ақталған еді. Осы ретте Kursiv.Media салалық министрлікке қазір қанша адам KazLLM-ді пайдаланып отырғанын және жобаға қанша қаржы жұмсалғанын сұрап сауал жолдаған.

Алайда Жасанды интеллект министрлігі мен Astana Hub тілдік модельді жасау мен дамытуға қанша қаржы жұмсалғанын ашық айтудан бас тартты.

«Жобаны қаржыландыру көлемі мен қаражат көздері туралы нақты мәлімет жарияланбайды, өйткені бұл ақпарат жобаға қатысты ішкі мәлімет болып саналады», – делінген жауапта.

LLM деген не?

Жасанды интеллект министрлігі баспасөз қызметінің түсіндіруінше, LLM – үлкен тілдік модель. Яғни жасанды интеллект өнімдері құрылатын негізгі платформа.

Қазақстандықтар кеңінен пайдаланатын ChatGPT секілді өнімдер – осындай модель негізінде жасалған, чат форматында қарым-қатынас жасауға арналған дайын қосымша.

«Басқаша айтқанда, LLM – негіз, ал ChatGPT – сол негізде жасалған өнім», – деп түсіндіреді мамандар.

Қазіргі кезде БАӘ, Сауд Арабиясы, Қытай, Ресей және басқа да елдер технологиялық егемендікті қамтамасыз ету мақсатында өздерінің ұлттық тілдік модельдерін әзірлеп жатыр.

«Бұл – ауқымды инвестицияны талап ететін стратегиялық бағыт. Әлемнің ірі компаниялары мұндай жобаларға жүздеген миллион доллар қаржы құяды, ал модельдер жылына орта есеппен 2-4 рет жаңартылып отырады», – делінген жауапта.

KazLLM-ді кім жасап шығарды

KazLLM моделін әу баста Назарбаев Университетінің Ақылды жүйелер және жасанды интеллект институты (ISSAI) өз қаражаты есебінен жасаған. KazLLM моделінің алғашқы нұсқасы 2024 жылғы 13 желтоқсанда таныстырылды.

Сол жылы 8 және 70 миллиард параметрлік нұсқаларда KazLLM ұсынылды. Модель академиялық және ғылыми қауымдастық тарапынан 138 мыңнан астам сұранысты өңдеген.

Қазір ISSAI институты KazLLM-ді заңды түрде Astana Hub-қа тапсырған.

Пайдаланушы аз ба, әлде есеп жоқ па?

KazLLM моделі 138 мыңнан астам сұранысты өңдегенімен, оны қазір нақты қанша адам қолданғаны белгісіз. Өйткені қазір бұл модельге қаржы құйылып жатқан жоқ.

Аstana Hub жауабына сәйкес, бүгінде қазақ тілін жақсырақ түсінетін жаңа AlemLLM моделі әзірленіп, қазіргі күш-жігер сол модельді дамытуға бағытталып жатыр.

Сондай-ақ модельдің ашық бастапқы кодта (Open-Source) екенін алға тартып, статистика тек ISSAI институтының қолында деп жауап берген.

KazLLM-нен AlemLLM-ге дейін

Салалық министрлік жауабына сәйкес, келесі кезең – қазақ, орыс және аралас форматта жұмыс істей алатын AlemLLM моделі. Бұл жергілікті контекстке бейімделуді едәуір арттырып, практикалық қолдану аясын кеңейткен көрінеді.

«Бүгінде отандық AlemLLM негізінде мемлекет, бизнес және азаматтардың нақты міндеттерін шешуге бағытталған 42 қолданбалы ЖИ өнімі әзірленіп жатыр. Олардың қатарында Qazaq Law цифрлық заң кеңесшісі, шетелдегі Қазақстан азаматтарын қолдауға арналған консулдық қызметтер агенті, мемлекеттік сатып алу мен салық салу бойынша цифрлық кеңесші, AI eGov және басқа да салалық шешімдер бар», – делінген жауапта.

Тағы бір маңызды фактор – AlemLLM мемлекеттік суперкомпьютерде орналастырылған және интернетке қосылмайтын оқшауланған аймақта жұмыс істейді.

Бұл деректер Қазақстанда ғана өңделіп, ақпараттың ел ішінде сақталуына және ұлттық цифрлық қауіпсіздік талаптарының сақталуына кепілдік бермек.

AlemLLM моделі ЖИ-модельдерген арналған Hugging Face хабында орналастырылған.