Жаңалықтар

«Қазақ тілінің ұлттық сөздік қоры» құрылып, жұмысы жасанды интеллектімен үйлестіріледі

Қазақ тілінің
«Қазақ тілінің ұлттық сөздік қоры» құрылады / Фото: shutterstock; бильд-редактор: Ахтам Зиперов

«Қазақ тілінің ұлттық сөздік қоры» құрылып, оның негізінде Қазақ тілінің ұлттық корпусы, терминологиялық база ашылады. Бұл туралы «Ашық НҚА» порталына шығарылған құжатта жазылған.

«Ұлттық сөздік қорды құрудың мақсаты – қазақ тілін мәдени құндылық ретінде сақтау, қорғау және дамыту, сондай-ақ мемлекеттік тіл мәртебесін нығайту, қазақ тілінің барлық қолданыс аясын қамтитын ресурстарды жинақтау, тілдің қолданыстағы лексикалық құрамын ретке келтіру, цифрландыру, генерациялау, оны жасанды интеллект пен заманауи технологияларға бейімдеу, өңдеу процестерін автоматтандыру», – делінген құжат түсіндірмесінде.

Құжатта Ұлттық сөздік қорды қалыптастыруды және жүргізуді тілдерді дамыту саласындағы уәкілетті орган айқындаған заңды тұлға іске асыратыны жазылған. Ұлттық сөздік қор – академиялық және аударма сөздіктер, Қазақ тілінің ұлттық корпусы, терминологиялық база және түрлі форматтағы мәліметтер жиынтығынан тұратын датасет негізінде қалыптастырылмақшы.

Ұлттық сөздік қорды қалыптастыру үшін мынадай шаралар атқарылады:

  • Ұлттық сөздік қорға қойылатын функционалдық және техникалық талаптарды, техникалық қызмет көрсету кестесін  және деректерді жинақтауға, өңдеуге, жүйелеуге арналған ақпараттық сипаттамалар бекітіледі;
  • интерактивті пайдаланушының интерфейсін, іздеу жүйесін және деректерді экспорттау мүмкіндігін қамтамасыз етіледі;
  • Ұлттық сөздік қормен интеграциялануға қабілетті ақпараттық ресурстардың тізбесі қалыптастырылады;
  • ашық деректер платформаларын пайдалану және халықаралық стандарттарға  сәйкес келуі қамтамасыз етіледі.

«Ұлттық сөздік қорды жүргізу мүдделі мемлекеттік органдар, мемлекеттік заңды тұлғалар, квазимемлекеттік сектор субъектілері, қоғамдық ұйымдармен, бизнес субъектілерімен өзара іс-қимыл жасай отырып жүзеге асырылады», – делінген құжатта.

Сонымен бірге ұлттық сөздік қорды басқа жүйелермен интеграциялау көзделген. Бұл мақсатта қорды сыртқы жүйелермен интеграциялау механизмі әзірленбекші. Яғни мәтіндерді өңдеу және талдау құралдарын әзірлеу арқылы сөздік қорды жасанды интеллект көмекшілерімен біріктіру жоспарланып отыр.

Ұлттық сөздік қордың дұрыс интеграцияланып, үздіксіз жұмыс істеуі үшін сенімді және жоғары өнімді бағдарламалармен қамтамасыз етіледі. Мәселен, үздіксіз жұмыс істеуі үшін серверлік қуаты жеткілікті болады және деректердің жоғалу қаупін болдырмау үшін автоматты резервтік көшіру жүйесін енгізіледі.

Айта кетейік Қазақ тілінің ұлттық корпусы құруды көздейтін заңды Сенат депутаттары 23 қаңтар күні мақұлдаған болатын. Ал заңға президент Қасым-Жомарт Тоқаев 11 ақпан күні қол қойған болатын.