Слепые зоны американского рынка ИИ: что вскрыл выпуск DeepSeek
![](https://cdn-kz.kursiv.media/wp-content/uploads/2025/02/07-07-1024x576.jpg)
После выхода DeepSeek-R1 20 января, который спровоцировал обвал акций производителя чипов Nvidia и целого ряда технологических компаний, некоторые аналитики заговорили о переломном, «спутниковом моменте» в китайско-американской гонке за лидерство в сфере искусственного интеллекта. Хотя индустрии ИИ в США, возможно, требовалась встряска, этот эпизод поднимает ряд сложных вопросов, пишет в колонке для Project Syndicate лауреат Нобелевской премии по экономике 2024 года Дарон Аджемоглу.
Ставка на масштабирование
Инвестиции американских технологических компаний в ИИ колоссальны: Goldman Sachs полагает, что крупнейшие технокомпании, корпорации и поставщики коммунальных сервисов в ближайшие годы направят около $1 трлн на капитальные расходы для поддержки ИИ. Однако на протяжении долгого времени многие, включая меня, ставили под сомнение направление, в котором движутся инвестиции и развитие ИИ в США.
Все ведущие компании по сути придерживаются одного и того же подхода (хотя Meta несколько выделяется за счет частично открытой модели). Индустрия явно «положила все яйца в одну корзину», и все без исключения сделали ставку на масштаб. Ссылаясь на еще не доказанные «законы масштабирования», компании предполагают, что чем больше данных и вычислительных мощностей будет вложено в их модели, тем большими возможностями они будут обладать. Некоторые даже утверждают, что «масштаб – это все, что нужно».
До 20 января американские компании не хотели рассматривать альтернативы базовым моделям, предварительно обученным на огромных массивах данных, для предсказания следующего слова в последовательности. Они сосредоточились почти исключительно на диффузионных моделях (упрощенно это такой тип моделей машинного обучения, которые учатся преобразовывать случайный шум в структурированные данные – прим.ред.) и чат-ботах, предназначенных для выполнения задач, аналогичных человеческим.
Подход DeepSeek в целом аналогичен. Но компания при тренировке своей модели, вероятно, больше опирается на обучение с подкреплением, использование множества небольших эффективных моделей (модель смеси экспертов), на методы дистилляции знаний (переноса знаний из более сложной модели в более простую) и уточнения цепочки рассуждений. Как сообщается, эта стратегия позволила компании создать конкурентоспособную модель гораздо дешевле.
Хотя остается открытым вопрос, рассказала ли DeepSeek всю правду о своем проекте, эта история, наряду с чрезмерным ажиотажем, выявила проблему «группового мышления» в американской индустрии ИИ, ее неспособность рассмотреть альтернативные, более дешевые и многообещающие подходы. Это именно то, о чем Саймон Джонсон и я предупреждали в книге «Власть и прогресс», написанной еще до начала эпохи генеративного ИИ. Теперь же возникает вопрос: есть ли у американской индустрии ИИ и другие, еще более опасные слепые зоны? Например, упускают ли ведущие технокомпании США возможность двигать свои модели в более «прочеловеческом» направлении? Я подозреваю, что да, но время покажет.
Могут ли авторитарные системы превзойти инклюзивные
Еще один важный вопрос – опережает ли Китай США? Если это так, означает ли это, что авторитарные централизованные структуры (то, что Джеймс А. Робинсон и я называли «экстрактивными институтами») могут конкурировать или даже превосходить децентрализованные системы, где инициатива исходит снизу, в стимулировании инноваций?
Я склонен считать, что контроль сверху тормозит инновации, как мы с Робинсоном утверждали в книге ««Почему одни страны богатые, а другие бедные»» (Why Nations Fail). Хотя успех DeepSeek ставит этот тезис под сомнение, он еще не доказывает, что инновации в рамках экстрактивных институтов могут быть столь же мощными и устойчивыми, как в инклюзивных институтах. В конце концов, DeepSeek использует наработки, созданные в США (и частично в Европе). Все ее базовые методы были впервые разработаны в Америке. Модели смеси экспертов и обучения с подкреплением были разработаны в академических учреждениях десятилетия назад, а трансформер-модели, модель цепочки рассуждений и дистилляция знаний были впервые внедрены крупными технологическими компаниями США.
DeepSeek успешно применила уже известные методы, комбинируя их более эффективно, чем американские компании. Остается открытым вопрос, смогут ли китайские компании и исследовательские институты сделать следующий шаг — разработать принципиально новые технологии, продукты и подходы.
Кроме того, DeepSeek, похоже, отличается от большинства других китайских компаний в области ИИ, которые, как правило, разрабатывают технологии для правительства или при государственной поддержке. Если эта компания (выделенная из хедж-фонда) до сих пор работала в тени, сможет ли она сохранить свою креативность и динамику теперь, когда оказалась в центре внимания? Как бы ни сложилась дальнейшая судьба DeepSeek, успех одной компании еще не является убедительным доказательством того, что Китай способен обойти более открытые и свободные общества в сфере инноваций.
Ошибка — в игре с нулевой суммой
Еще один аспект — геополитика. Означает ли история с DeepSeek, что экспортный контроль США и другие меры по сдерживанию китайских исследований в области ИИ провалились? Ответ пока неясен. Хотя DeepSeek обучала свои последние модели (V3 и R1) на старых, менее мощных чипах, для дальнейших достижений и масштабирования ей, возможно, понадобятся самые современные процессоры.
Тем не менее, очевидно, что стратегия США, основанная на принципе нулевой суммы (когда выигрыш одной стороны непременно означает проигрыш другой – прим. ред) оказалась неработоспособной и ошибочной.
Такой подход имеет смысл только в том случае, если вы считаете, что мы движемся к созданию искусственного общего интеллекта (AGI), способного конкурировать с человеком во всех когнитивных задачах, и что страна, которая первой достигнет AGI, получит огромное геополитическое преимущество. Придерживаясь этих предположений, которые вовсе не являются гарантированными, США лишили себя плодотворного сотрудничества с Китаем во многих областях. Например, если одна из стран разрабатывает модели, повышающие человеческую продуктивность или помогающие регулировать энергопотребление, такие инновации были бы полезны для обеих стран, особенно если они широко используются.
Как и американские конкуренты, DeepSeek стремится к созданию AGI, а создание моделей, обучать которые обходится значительно дешевле, может стать фактором, меняющим правила игры. Однако снижение стоимости разработки с помощью уже известных методов не приведет к чудесному прорыву в AGI в ближайшие годы. Возможность создания AGI в обозримом будущем остается открытым вопросом (и еще более спорно, действительно ли это то, к чему мы хотим прийти).
Хотя мы еще не знаем всех деталей разработки моделей DeepSeek и того, что ее достижения означают для будущего индустрии ИИ, одно кажется очевидным: китайская компания нарушила догму технологической индустрии о масштабировании и, возможно, даже пошатнула ее чрезмерную уверенность в верности данного подхода.
Copyright: Project Syndicate, 2025.
www.project-syndicate.org