Кто такой Лян Вэньфэн. Основатель DeepSeek с «ужасной прической»

Опубликовано 28 января 2025 13:34

Татьяна Кондратьева

Татьяна Кондратьева

Корреспондент отдела Kursiv LifeStyle t.kondratyeva@kursiv.media
DeepSeek
Источник: x.com/RadioEjani, бильд-редактор Артур Алескеров

Выпуск языковой модели DeepSeek R1, «китайского ChatGPT», всколыхнул Кремниевую долину, обвалил акции производителя чипов Nvidia и сделал основателя DeepSeek предметом национальной гордости на родине. Kursiv LifeStyle рассказывает, кто такой Лян Вэньфэн.

В отличие от главы OpenAI Сэма Альтмана, предпринимателя Кремниевой долины, Лян Вэньфэн не соответствует образу пионера AI.

Источник: x.com/RadioEjani

Лян Вэньфэн родился в Чжаньцзяне, провинция Гуандун, в 1985-м. После окончания Чжэцзянского университета и изучения машинного зрения, Лян стал учредителем хедж-фонда High-Flyer. Компания зарегистрирована в 2015 году.

Лян Вэньфэн начал закупать тысячи графических чипов Nvidia для своего проекта в 2021-м. В то время знакомые Ляна считали это странным хобби, которое никуда не приведет.

«Когда мы впервые встретились с ним, он был очень занудным парнем с ужасной прической, который рассказывал о создании кластера на 10 тысяч чипов для обучения своих собственных моделей. Мы не восприняли его всерьез», – поделился один из деловых партнеров Ляна.

Лян хотел «изменить правила игры», но не мог сформулировать свое видение проекта. Партнеры считали, что подобное было возможно только для технологических гигантов, таких как ByteDance и Alibaba Group.

В High-Flyer Лян сколотил состояние, используя искусственный интеллект для выявления закономерностей, влияющих на цены акций и в 2023 году заявил о намерении разработать AI уровня человеческого интеллекта, запустив уже известный нам DeepSeek. 100 тыс. чипов Nvidia A100 заложили основу работу DeepSeek до того, как правительство США ввело ограничения на поставку чипов в Китай. Компания полностью финансировалась за счет средств хедж-фонда.

Лян Вэньфэн нанял лучших инженеров в DeepSeek, щедро оплачивая их труд наравне с ByteDance, владельцем TikTok. DeepSeek позиционируется как китайская компания, в которой работают специалисты из лучших китайских школ и университетов (Пекина, Цинхуа и Бэйхана), а не приглашенные эксперты из США.

«Офисы DeepSeek напоминают университетский городок для серьезных исследователей», – говорит деловой партнер Ляна. – Команда верит в видение Ляна: показать миру, что китайцы могут быть креативными и создавать что-то с нуля».

О том, как бесплатная модель искусственного интеллекта R1 с открытым исходным кодом, на создание которой ушло 55 дней и $5,6 млн, действительно изменила правила игры, можно прочитать в другом материале Kursiv.

Читайте также