DeepSeek ломает мир ИИ: специализация и новые профессии для людей

вице-президент по управлению данными и розничному риск-менеджменту банка ЦентрКредит

Насколько появление DeepSeek может изменить расстановку сил среди разработчиков Искусственного Интеллекта (ИИ)? 

Появление DeepSeek, по сути, ломает привычный шаблон — она демонстрирует высокую интеллектуальную способность на уровне вышеуказанных гигантов.

Также показывает высокую производительность при сравнительно низких затратах на обучение, что уже заинтересовало экспертное сообщество и потенциально может «оттянуть» часть пользователей от закрытых проприетарных моделей.

Сейчас на рынке LLM доминируют несколько крупных игроков, среди которых

  • OpenAI (ChatGPT/GPT-4),
  • Google (‎Gemini),
  • Meta (Llama) и
  • Anthropic (Claude).

Однако ситуация стремительно меняется: растёт количество открытых моделей (Mistral, Falcon и др.), а вместе с ними – конкуренция и разнообразие решений.

Появление DeepSeek это еще не конец доминирования OpenAI, но сигнал инвесторам о том, что рынок переходит в стадию более жёсткой конкуренции. Это может подстегнуть OpenAI и других лидеров к 

  • снижению цен, 
  • ускорению собственных разработок, 
  • оптимизации моделей и 
  • предложения новых вариантов лицензирования.

Кто победит в этой гонке? Нельзя назвать имя, но можно назвать критерии победителя – это тот, кто 

  • быстрее адаптирует AI к конкретным бизнес-нуждам, обеспечивая при этом информационную и регуляторную безопасность и
  • поддержит тренд на уменьшение размеров моделей, ведь это позволит использовать ИИ ещё шире без чрезмерных затрат на инфраструктуру.

В чем главное преимущество DeepSeek сейчас? 

  • Исходный код и веса модели доступны под либеральной лицензией (MIT и аналоги), что снижает барьеры для интеграции DeepSeek в любые экосистемы,
  • Относительно невысокая цена и стоимость в эксплуатации. 

В сумме с относительной доступностью кода эта модель может занять серьезную долю на рынке – что мы уже увидели по падению акций OpenAI. У ChatGPT достаточно серьезные минусы: 

  • высокие операционные затраты из-за огромного числа запросов и централизованного облака, 
  • отсутствие открытого кода, 
  • компаниям приходится платить за запросы по подписке или интеграции API. 

DeepSeek же, будучи системой с условно открытым кодом, позволяет часть вычислений или всю систему перенести на собственные кластеры…

Ключевой вопрос: насколько DeepSeek доступен по сравнению с ChatGPT? Это данные уже для знатоков:

  • Масштаб модели: DeepSeek-R1 имеет внушительное число параметров (упоминаются цифры от 37 млрд «активно» используемых параметров до 671 млрд «всего» — видимо, смесь технологий типа Mixture-of-Experts), что обеспечивает широкий спектр способностей к генерации и рассуждению. Что в сравнении с аналогами выглядит меньше по архитектуре. 
  • Оптимизация вычислительных затрат: Заявленная стоимость обучения (5–6 млн долларов) — в разы ниже, чем у конкурентов (60–100 млн), что стало возможным благодаря комбинации новых алгоритмических техник и умелому использованию уже имеющихся моделей.
  • Возможность дистилляции: DeepSeek поддерживает перенос своих «навыков» на более маленькие модели через методы distillation, что позволяет решать более узкие бизнес-задачи на меньших объёмах вычислительных мощностей.

Эти особенности делают DeepSeek заметным игроком на рынке и обращают на неё внимание как со стороны крупных корпораций, так и со стороны независимых разработчиков.

А как быть с минусами? Ведь это китайская разработка – что с конфиденциальностью данных? Да, государственное регулирование Китая допускает возможность мониторинга ИИ-моделей. У корпоративных пользователей DeepSeek появляются репутационные риски: если возникают подозрения в намеренном или случайном сборе данных, может последовать регуляторная проверка.

Но это проблема не только DeepSeek. В целом все крупные модели, будь то из США, Китая или Европы, требуют тщательной оценки рисков и внедрения соответствующих мер кибербезопасности: изоляция среды, шифрование данных, мониторинг использования и т. д.

Между тем появление DeepSeek на рынке приближает момент, когда барьеры для использования со стороны стартапов и средних компаний снижаются, и они смогут разрабатывать собственные модификации на базе публичных LLM.

Для корпоративных пользователей (включая банки) это означает:

  • Возможность быстрого развёртывания моделей на собственных серверах без колоссальных трат.
  • Рост количества кастомизированных решений: каждая индустрия может адаптировать AI под свои нужды.

Однозначно можно сказать, что ИИ вокруг нас станет еще больше. Но если раньше это казалось ударом по рынку труда, то теперь, после нескольких лет практического применения, стало понятно, что темпы роста ИИ падают, он не становится намного умнее. Начинается период узкой специализации. Создаются нишевые модели для конкретных задач (медицина, финансы, логистика и т. д.), которые показывают более высокую точность, чем универсальные модели.

Да, это приведет к тому, что часть рутинных человеческих профессий будет замещена ИИ. Но при этом возникнут новые: 

  • разработчики и интеграторы ИИ, 
  • цифровые аудиторы, 
  • специалисты по валидации и т. д.

Скорее всего, появление DeepSeek это не «конец» доминирования OpenAI, но начало более жесткой конкуренции.