Шесть вопросов о DeepSeek: что надо знать о «китайском ChatGPT», обвалившем акции

DeepSeek R1 показывает не только готовый ответ, но и всю цепочку рассуждений, имитируя процесс логического мышления человека / Фото: Reuters

Китайская компания DeepSeek, которую CNBC 24 января назвал «малоизвестной лабораторией», вызвала панику в Кремниевой долине, а также обрушила мировые акции. 20 января DeepSeek выпустила бесплатную модель искусственного интеллекта R1 с открытым кодом, на создание которой, как утверждает компания, ушло лишь два месяца и меньше $6 млн. Независимые тесты производительности показали, что китайская нейросеть превзошла языковые модели Llama 3.1 от Meta, GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic в различных задачах — от решения сложных проблем до математики и программирования. В выходные приложение DeepSeek возглавило рейтинги App Store в нескольких странах, включая США.

Эти новости вызвали обвал акций технологических компаний США и Европы на $1 трлн 27 января. Американский производитель чипов Nvidia обвалился на 15%. Что вызвало такую реакцию у инвесторов?

Что известно о DeepSeek

На самом деле DeepSeek вряд ли можно назвать «малоизвестной лабораторией». Компанию основал в 2023 году китайский предприниматель Лян Вэньфэн. Он также руководит хедж-фондом High-Flyer, которому принадлежит DeepSeek и другие компании, специализирующиеся на искусственном интеллекте.

Впервые о DeepSeek стало известно в ноябре 2023 года, когда компания выпустила DeepSeek Coder — модель с открытым исходным кодом, предназначенную для решения задач кодирования. В мае 2024 года DeepSeek представила большую языковую модель DeepSeek-V2, которая всколыхнула местный рынок ИИ своей высокой производительностью и низкой стоимостью, заставив IT-гигантов ByteDance, Tencent, Baidu и Alibaba снизить цены на использование своих языковых моделей.

В ноябре 2024 года DeepSeek открыла доступ к большой языковой модели следующего поколения – DeepSeek-V3. После этого о китайском стартапе заговорили во всем мире.

И вот теперь новый релиз – 20 января компания представила большую языковую модель DeepSeek R1. К 25 января мобильное приложение DeepSeek было загружено 1,6 млн раз и заняло первое место в магазинах приложений для iPhone в США, Канаде, Великобритании, Китае, Сингапуре и Австралии, согласно данным рыночного трекера App Figures.

В чем принципиальное отличие R1 от других моделей ИИ

Первое и главное отличие для пользователей состоит в том, что DeepSeek R1 показывает не только готовый ответ, но и всю цепочку рассуждений и взаимосвязей. Таким образом модель имитирует процесс логических рассуждений человека.

Вторая принципиальная разница – использование архитектуры MoE. Она похожа на работу экспертного совета, в котором каждый участник — специалист только в одной области, и когда пользователь задает вопрос, в обработке и создании ответа участвует не весь экспертный совет, а конкретный специалист. Аналогично архитектура DeepSeek MoE активирует только необходимые параметры для каждой задачи, что приводит к значительной экономии ресурсов и повышению производительности.

Третье отличие — чисто техническое. DeepSeek R1 — полностью открытый код, который позволяет сторонним разработчикам не только использовать технологию для коммерческих целей, но и адаптировать ее для решения различных задач в сфере искусственного интеллекта.

DeepSeek утверждает, что модель приближается или превосходит конкурентов в таких областях как кодинг, математика, общие знания, а также по уровню ведения диалога. Американский Forbes пишет, что модель DeepSeek все же показывает сопоставимые результаты с конкурентами от OpenAI и Meta по определенным параметрам, но для ее обучения и работы требуется меньше вычислительных мощностей. По информации MIT Technology Review, на который ссылается Forbes, это, вероятно, результат американских экспортных ограничений на самые передовые чипы для ИИ, которые вынуждают стартапы в Китае «приоритезировать эффективность». Эта эффективность также позволила DeepSeek значительно снизить цены по сравнению с OpenAI на свои услуги — стоимость интерфейса прикладного программирования (API) у нее составляет $0,55 за миллион входных токенов и $2,19 за миллион выходных против $15 и $60 соответственно у OpenAI.

Есть ли цензура в чат-боте DeepSeek

Американский Forbes пишет, что да. Как и несколько крупных технологических платформ из Китая, DeepSeek, похоже, цензурирует контент, который считается чувствительным для Пекина. Например, при запросе о протестах на пекинской площади Тяньаньмэнь чатбот отвечает: «Извините, это выходит за рамки моих текущих возможностей. Давайте поговорим о чем-нибудь другом».

Почему релиз DeepSeek всколыхнул мировые рынки

Релиз новой языковой модели от китайского стартапа вызывает много вопросов как в политическом, так и финансовом плане, отмечает Bloomberg. На протяжении многих лет Вашингтон пытается ограничить доступ Пекина к некоторым высокотехнологичным устройствам, необходимым для развития искусственного интеллекта. Эти меры призваны не только затормозить успех китайских компаний на мировом рынке ИИ, но и обеспечить технологическое доминирование американских стартапов в этой отрасли.

Успех DeepSeek, который смог за незначительные деньги создать эффективную языковую модель с помощью не самых мощных чипов H800 от Nvidia, ставит под сомнение эффективность ограничений на экспорт, а также доминирование американских компаний на рынке, пишет Reuters со ссылкой на аналитиков.

«Если действительно случился прорыв и стоимость обучения моделей снизилась с $100 млн и более до предполагаемых $6 млн, это на самом деле очень позитивно для производительности и конечных пользователей ИИ. Для них это означает более доступные цены», — сказал Reuters старший управляющий портфелем Pictet Asset Management Джон Уитар.

Иными словами, теперь OpenAI, Meta AI и другим гигантам станет куда сложнее оправдывать свои колоссальные расходы на инфраструктуру и разработку, а их поставщикам – цены на оборудование, говорят аналитики.

«DeepSeek демонстрирует, что можно разрабатывать мощные модели ИИ при меньших затратах, — сказал Bloomberg Вей-Серн Лин, управляющий директор Union Bancaire Privée. — Это может потенциально подорвать инвестиционную привлекательность всей цепочки поставок ИИ, которая основывается на высоких расходах небольшого числа гипермасштабируемых компаний».

Алексей Дебелов, партнер FP Wealth Solutions, написал в своем телеграм-канале, что в реальности у DeepSeek ниже только количество используемого софта, но количество персонала и стоимость обработки данных все еще остаются высокими для китайской компании. Но в целом новость о выходе R1 он считает позитивной: затраты на ИИ будут ниже, а рост производительности — выше. А так как DeepSeek — модель с открытым исходным кодом, конкуренция в сфере технологий может вырасти за счет появления новых разработчиков.

Как релиз R1 повлияет на Nvidia

Конкурентоспособная модель ИИ DeepSeek, созданная за 5% капитальных затрат ее западных аналогов, ослабляет оптимизм в отношении ИИ, пишет Дебелов. По его словам, от этого особенно рискует пострадать Nvidia, поскольку спрос на ее продукцию и ее рентабельность может оказаться «значительно завышенным».

Старший управляющий портфелем Pictet Asset Management Джон Уитар сказал Reuters, что текущая ситуация окажет негативное влияние на Nvidia в краткосрочной перспективе. «Ожидания от (чипов Nvidia) Blackwell невероятно высоки… Но в конечном счете, все, что делает ИИ дешевле для внедрения, положительно для тех, кто продает продукты и приложения, связанные с ИИ, и использует инструменты ИИ», — говорит он.

Инвестор и стратег Эд Ярдени считает, что Nvidia может пострадать, если ее клиентам больше не нужно будет огромное количество технически сложных чипов. Но, по его словам, это может быть хорошими новостями для акций других компаний, входящих в «Великолепную семерку» — они могут учиться у DeepSeek и разрабатывать ИИ-системы с более дешевыми графическими процессорами. «Это снизит их капитальные расходы и увеличит прибыль. Но это может быть не самым радостным развитием для Nvidia», — добавил Ярдени.

Акции Nvidia в ходе торгов 27 января падали на 15% до минимума с марта 2024 года.

Как DeepSeek повлияет на мировой рынок AI моделей

Успех DeepSeek означает рост давления на американских лидеров отрасли, пишет Bloomberg. Вероятно, OpenAI и другим разработчикам придется пойти на снижение цен. Кроме того, кейс китайского стартапа, создавшего эффективную модель с небольшими затратами, может вызвать у инвесторов вопросы к гигантам вроде Meta и Microsoft, которые в этом году собираются потратить $65 млрд или более на инвестиции в ИИ, отмечает агентство.

Выпуск DeepSeek R1 также может стать новой вехой развития для языковых моделей с открытым исходным кодом, отмечает Forbes. Уже сейчас разработчики по всему миру экспериментируют с программным обеспечением DeepSeek и стремятся создавать на его основе инструменты. Это может ускорить внедрение передовых моделей искусственного интеллекта. Кроме того, подход DeepSeek с открытым исходным кодом повышает прозрачность и подотчетность в разработке ИИ.