Зачем правительствам когнитивные сервисы
Что такое когнитивные сервисы и как они помогают правительствам становится по-настоящему цифровыми, «Курсиву» рассказал директор по вопросам национальных технологических стратегий и политики для 24 стран региона Центральной и Восточной Европы компании Microsoft Михаил Шмелев.
— Михаил, дайте, пожалуйста, простое определение – что такое когнитивные технологии?
— Позволю себе сослаться на определение Deloitte, которое было сформулировано еще несколько лет назад. Когнитивные технологии — это продукты искусственного интеллекта. Они могут выполнять задачи, которые раньше могли выполнять только люди. Примеры когнитивных технологий включают компьютерное зрение, машинное обучение, обработку естественного языка, распознавание речи и робототехнику.
Нужно понимать: когда мы говорим о когнитивных технологиях, мы подразумеваем использование возможностей искусственного интеллекта (ИИ).
ИИ можно сравнить с фундаментальной научной дисциплиной, а когнитивные технологии — это уже конкретные инструменты, использующие ИИ для решения тех или иных задач. Они могут видеть, слышать, понимать и рассуждать как люди. Здесь вернее даже говорить о когнитивных сервисах, потому что именно они предлагают конкретные сценарии использования ИИ и сейчас уже достаточно доступны. Если вы создаете презентацию в PowerPoint, вы уже используете возможности ИИ. Программа рекомендует форматы оформления, подставляет шаблоны – это отработавший в облаке ИИ предлагает вам вариант, созданный на основании анализа действий сотней тысяч пользователей. Если вы взаимодействуете со своим смартфоном, то с 99%ой вероятностью вы используете когнитивные сервисы — будь биометрия, Siri, или любой другой голосовой помощник.
Формулировка «достаточно доступны» означает доступность не только для пользователей, но и для разработчиков. Cognitive Services от Microsoft — это специальный набор алгоритмов ИИ и интерфейсов прикладного программирования (API), который позволяет разработчикам добавлять возможности ИИ к своим сайтам, приложениям или агентам ИИ (самые типичные из них – чат-боты). Другими словами, Cognitive Services позволяют компаниям, не имеющим в штате ни дата-сайентистов (исследователей в области искусственного интеллекта), ни инфраструктуры, ни бюджета для всего этого, встраивать когнитивные сервисы в свои бизнес-процессы и свои приложения.
— Вы говорите о конкретных сценариях использования возможностей искусственного интеллекта. Какими эти сценарии могут быть?
— На сегодня день мы можем говорить о пяти основных категориях когнитивных сервисов от Microsoft. Первая категория – это сервисы, направленные на поддержку принятия решений. В этой категории я бы упомянул сценарий обнаружения аномалий и повышения надежности каких-либо систем за счет раннего обнаружения проблем.
Например, такой когнитив-сервис может анализировать бизнес-данные заказчика, и, видя некие отклонения, выделять их и транслировать эксперту, поскольку они «вываливаются» из общего стройного ритма данных.
В эту же категорию попадает фильтрация контента — это обнаружение потенциально оскорбительных изображение, ненормативной лексики, нежелательного текста, контента для взрослых, видео непристойного содержания. Все это есть как сервис в облаке, который может быть подключен в любое разрабатываемое приложение.
Вторая категория — сервисы, которые помогает извлечь смысл из неструктурированного текста. Один вариантов — иммерсивное чтение, которое помогает читателю любого уровня подготовки понимать текс, используя звуковые, визуальные подсказки. Активно применяется в образовании.
Сюда же попадает понимание естественного языка. Эта функция обеспечивает понимание естественного языка в приложениях — ботах и устройствах интернета вещей. Многие компании перешли на электронную форму общения с заказчиками, думаю, вы сами неоднократно видели в интернет-магазинах всплывающее окошко «Я менеджер Асель, чем вам помочь?». Человек начинает писать свой вопрос на естественном языке, но там нет Асель, это бот, когнитивный сервис. Который понимает, что ему пишут, поскольку на основе распознавания неструктурированного естественного языка делает вывод, о чем вы спрашиваете. В этой же категории анализ текста, выявление ключевых фраз и сущности, и переводчики тоже здесь — на сегодняшний день у нас соответствующий когнитивный сервис переводит с более чем и на 60 языков.
Третья категория — интеграция обработки речи в приложения и сервисы. Здесь есть распознавание речи и превращение ее в текст, синтез речи и превращение текста в речь, распознавание и синхронный перевод речи — это интегрируется в реальном времени в необходимые приложения. Сюда же попадает идентификация говорящего – можно использовать например, на больших онлайн-конференциях, автоматически выявляя говорящего по голосу. А можно использовать просто для голосовой идентификации.
Четвертая большая категория – это сервисы для идентификация и анализ контента (изображений, видео, отсканированного текста). Во-первых, это компьютерное зрение, которое анализирует изображение. Если объяснять максимально упрощенно, то натренированная математическая модель определяет, что именно изображено, на основе описания ключевых точек, чтобы понять – вот это автомобиль, а это – собака. Вторая подкатегория здесь — это кастомизированное зрение и распознавание. Объясню на примере –по железной дороге проходит огромное количество грузовых вагонов. Камера, направленная на определенное место, позволит распознавать номера проходящих вагонов для того, чтобы понимать – где сейчас находится этот вагон, какую станцию прошел, у кого в аренде.
Распознавание лиц — идентификация и обнаружение людей и эмоций на изображениях – такой когнитивный сервис тоже существует. И если чтобы он распознавал конкретных людей, его предстоит обучить, то эмоции он распознает вне зависимости от того, на чьих фото модель тренировали. В эту же категорию входят распознавание и обработка печатных или сканерных форм – например, быстро обрабатывать бюллетени после голосования.
И последняя подкатегория здесь — анализ визуальных и аудиоканалов, и индексация содержимого. Это, условно говоря, автоматическое категоризирование. То есть такой когнитивный сервис можно направить на огромное количество видео. Он скажет — на этом видео пение птиц, на этом — военные учения и даже глубже проанализирует, опознает танки, машины, людей и поставит эти метаданные при описание видео. Такие сервисы очень важны для банков фото и видео.
И пятая категория – это интеллектуальный поиск , встроенный в Microsoft Bing. Поиск по изображением, по звуковым файлам, контекстный поиск — вся мощь поисковых систем — это тоже когнитивный сервис, который Microsoft предоставляет в виде готового к использованию интерфейса и дает возможность разработчикам встроить его в свои системы.
Сейчас 75% приложений в той или иной форме используют технологию ИИ и когнитивные сервисы — просто мы этого не замечаем. А взрывоподобное развитие таких интеллектуальных приложений связано как раз с тем, что сейчас разработчикам не нужно самим создавать эти сервисы – они берут когнитивные сервисы Microsoft как сырье, как готовый кирпичик. Такой сервис постоянно подключен и использует для эффективности всю мощь публичного облака Microsoft Azure.
— Как когнитивные сервисы могут применять правительства и для чего?
— В текущей ситуации как минимум для того, чтобы поддержать сотрудников, работающих из дома, и беспрепятственно обслуживать граждан. На сегодня цифровая трансформация государства — это не замена старых компьютеров на новые, и не покупка нового Microsoft Office или новой ОС. Это настройка процессов, чтобы автоматизировать всю рутину. А для этого в более чем 90% случаев необходимо использовать возможности ИИ, а значит — когнитивных сервисов из облака Microsoft, сразу готовых к использованию нашими партнерами и заказчиками. Повторюсь, что и бизнесу, и государству нет нужды инвестировать в RnD, связанные с ИИ. Это не является их профильной функцией. Мы же создаем такие инструменты с начала 90-ых годов прошлого века – именно тогда появился Microsoft Research, и фактически тремя первыми исследовательскими группами там были группа обработки естественного языка, группа computer vision и группа computer speech.
— Какие кейсы использования когнитивных сервисов Microsoft на уровне государства уже существуют?
— Их достаточно много, прежде всего это всевозможные инструменты электронного правительства для взаимодействия с людьми в натуральной языковой форме – чат-боты, или разговор с роботом. Такой подход позволяет государству очень здорово снизить расходы на колл-центры.
Кстати, во время пандемии международные организации здравоохранения, заваленные запросами пациентов, создали и развернули 1230 ботов на основе наших когнитивных сервисов для того, чтобы люди могли сами оценить – есть ли у них признаки COVID-19, или нет. Этими приложениями были охвачены 18 миллионов человек.
Помните голливудские фильмы, когда по фотографии спецслужбы находят через камеры человека в толпе? Такие возможности тоже существуют, хотя использование подобной технологии зависит от законодательного поля в каждой отдельно взятой стране.
Среди кейсов — системы управления дорожным движением, и речь идет не только про камеры, которые следят за превышением скорости и нарушением правил ПДД. Это в том числе прогнозирование загруженности транспортной инфраструктуры, которая позволяет как управлять светофорами, так и делать долгосрочное планирование реконструкции дорог на основе визуального анализа класса автомобилей, которые по этой дороге ездят. В условиях эпидемии коронавируса когнитивные сервисы Microsoft так же используются для анализа и предсказания развития пандемической ситуации.
— Существует универсальный алгоритм для государств по цифровой трансформации с использованием когнитивных сервисов – другими словами, с чего лучше всего начинать?
— Каждая страна, каждое правительство ищет свой путь, исходя из своих приоритетов, своих задач, своего законодательства. А мы всегда рядом, готовы поделиться лучшими практиками. Microsoft участвовал в огромном количестве проектов в разных странах и большинство из них – достаточно успешны.
По собственному опыту можем сказать, что очень часто цифровизация государств начинается с умных городов, яркими примерами здесь могут выступать Барселона или Лондон – мегаполисы, которые в силу своей загруженности просто вынуждены делать свои транспортные системы интеллектуальными. Но и небольшие города используют когнитивные сервисы, которые позволяют, например, эффективно управлять освещением – то есть включать его не по таймеру, а в зависимости от реального уровня освещенности, который распознает как раз когнитивный сервис.
Мы видим, что чем дальше, тем больше государства используют когнитивные сервисы, потому что понимают их необходимость. Граждане в эпоху четвертой индустриальной революции становятся все более требовательны к качеству государственных услуг и хотят получать их быстро и качественно даже во время кризиса из-за пандемии. Правительству приходится не только продолжать оказывать критически важные гражданские услуги безопасным образом – то есть в электронном виде, и одновременно реагировать на кризис. И для этого нужно не расширять бюрократический аппарат, а делать более эффективным существующий, вооружая госслужащих мощными средствами когнитивных сервисов.
Партнерский материал