ChatGPT и другие ИИ заговорят на казахском языке к середине 2024 года

Опубликовано
корреспондент отдела General News
Казахский язык адаптируют к глобальной языковой модели LLM / Фото: коллаж kursiv.media

В Казахстане планирует завершить адаптацию казахского языка к большим языковым моделям искусственного интеллекта LLM (Large Language Model) к середине 2024 года. Об этом «Курсиву» рассказал представитель Минцифры Гиззат Байтурсынов. По его словам, сейчас этим занимаются два министерства и зарубежные партнеры, которые оказывают консалтинговые услуги.    

«Мы сейчас проводим работу по созданию казахстанской языковой модели LLM, а запуск планируется к середине этого года — в июне или июле. Этим занимается наше министерство, подведомственные организации и нам активно помогает министерство науки и высшего образования. На текущий момент мы сами собираем данные и параллельно обучаем казахстанскую языковую модель, чтобы она заговорила на казахском. Пока сложностей никаких нет», — рассказал директор Департамента развития электронной промышленности и индустрии цифровых активов Байтурсынов в кулуарах мажилиса.

Он также поделился, что к середине года запланирован запуск суперкомпьютера, вычислительные мощности которого нужны для разработки и применения искусственного интеллекта (ИИ) в разных отраслях экономики.

«Для разработки чего-либо с использованием ИИ требуются две вещи: первая — вычислительные мощности, второе — данные. Данные мы планируем предоставлять за счет национальной платформы Smart data ukimet, где сейчас собирается определенный data-lake (озеро данных. — прим. ред.). А вычислительные мощности — мы сейчас занимаемся разработкой суперкомпьютера с помощью зарубежной компании G42. И планируем в этом году уже этот суперкомпьютер запустить», — добавил директор департамента.

Большие языковые модели (LLM) применяют чат GPT и другие ИИ-платформы для анализа и создания текстов. Эти модели используют методы глубокого обучения, включая нейронные сети, что дает им возможность изучать и интерпретировать обширные массивы информации.

Казахстанская языковая модель LLM также будет использовать алгоритмы и обширные данные для понимания и генерации текста, но будет обучаться на большом объеме казахоязычных текстовых данных. Это позволит ей предоставлять более естественные и интуитивные способы коммуникации для казахоязычных пользователей. Она может применяться для интеграции ИИ-технологий, улучшения обслуживания клиентов через чат-боты, оптимизации поисковых систем и создания образовательных инструментов. 

В середине декабря 2023 года президент Казахстана Касым-Жомарт Токаев сообщил, что собирается лично курировать создание системы ИИ в стране. По его словам, он будет проводить встречи со специалистами и следить за выполнением задач, которые поставил.

В феврале 2024 года стало известно, что в Казахстане создадут спецкомиссию по регулированию искусственного интеллекта (ИИ), которая будет оценивать безопасность развития новых технологий в этой сфере. Это прописано в проекте Концепции развития ИИ на 2024–2029 годы.

Кроме того, согласно концепции, правительство намерено довести долю госуслуг, предоставляемых с помощью ИИ, с 0% в нынешнем году до 20% к 2029 году. Помимо этого, правительство планирует поэтапно повышать объем грантового финансирования для стимулирования ИИ с 2 млрд в этом году до 4 млрд тенге в 2029 году. 

Читайте также