Картина мира
30 января, 2025

«Зануда с ужасной прической»: история основателя DeepSeek

Как сын учителя из китайской провинции создал самый обсуждаемый проект 2025 года и обошел ChatGPT

«Зануда с ужасной прической»: история основателя DeepSeek

Photo: The New York Times

Китайская нейросеть DeepSeek всего за пару недель обрела всемирную популярность: ее приложение в считанные дни вышло на первое место в App Store. И даже внезапно обрушила акции крупнейших технологических корпораций. Это пример очень стремительной истории успеха. Всего месяц назад мало кто за пределами Китая знал о существовании этой компании, а о ее основателе — еще меньше. Рассказываем, кто стоит за созданием самой популярной нейросети 2025 года и почему мировые СМИ уже называют этого человека «китайским Сэмом Альтманом».

Отличник с верой в ИИ

О жизни Ляна Вэньфэна известно не так много — до января 2025 года он дал всего два небольших интервью китайским журналистам (первое, второе). Родился будущий создатель DeepSeek в 1985 году в портовом городе Чжаньцзяне в китайской провинции Гуандун. В интервью местной прессе Вэньфэн говорил, что его отец был учителем начальной школы, американские СМИ утверждают, что его мать тоже преподавала детям. По словам самого Вэньфэна, родители привили ему любовь к учебе с детства: он всегда был круглым отличником, а в средней школе начал самостоятельно изучать математический анализ. Любопытство останется одной из главных черт характера Ляна и во взрослом возрасте: коллеги по DeepSeek будут отзываться от нем как о человеке с «ужасающей способностью к обучению».

После выпуска из школы в 2002 году Вэньфэн поступил в Чжэцзянский университет — один из старейших и самых престижных вузов Китая. Среди известных выпускников, например, Колин Хуан, основатель и бывший генеральный директор китайского гиганта электронной коммерции Pinduoduo. Вэньфэн получил степень бакалавра технических наук в области электронной информационной инженерии, а спустя три года стал  магистром. Уже в 2008 году он был уверен, что искусственный интеллект изменит мир, хотя на тот момент мало кто разделял его мнение.

Первые эксперименты

После окончания университета многие однокурсники Вэньфэна устроились программистами в технологические корпорации, но сам он пошел другим путем. Хотя предложения были: так, в начале 2010-х друг Вэньфэна Ван Тао приглашал его в свою команду по разработке летательных аппаратов в Шэньчжэне. Но Вэньфэн отказался, а Тао вскоре основал компанию DJI, ставшую крупнейшем разработчиком дронов в мире.

Вэньфэн переезжает в Чэнду и арендует там дешевую квартиру, которая также служит ему офисом. Там он начинает экспериментировать с искусственным интеллектом в сфере финансов: использует алгоритмы для создания торговых стратегий, прогнозирования тенденций и принятия инвестиционных решений. Инструмент, который разрабатывал Лян на своей кухне, должен был помочь частным инвесторам и компаниям торговать ценными бумагами на бирже. 

В 2013 году Вэньфэн основал инвестиционную компанию Jacobi, которую назвал в честь немецкого математика Карла Якоби. А через два года вместе с двумя университетскими друзьями создал хедж-фонд High-Flyer, который к 2019 году уже управлял активами на сумму $10 млрд. Сегодня фонд считается одним из крупнейших в Китае. 

Поначалу High-Flyer использовал уже существующие алгоритмы машинного обучения, а в октябре 2016 года создал первую собственную модель искусственного интеллекта. В это же время фонд произвел свой первый реальный торговый ордер, целиком сформированный ИИ: алгоритм сам купил или продал ценные бумаги без участия человека.

Уже к концу следующего года High-Flyer стала применять ИИ-расчеты практически во всех своих стратегиях: алгоритмы научились сами определять, когда покупать или продавать акции. В 2018 году компания получила премию Golden Bull Fund Award — одну из самых авторитетных наград в инвестиционной индустрии Китая. 

DeepSeek. Начало 

В мае 2023 года Вэньфэн основал проект DeepSeek — сначала как ответвление от основного бизнеса хедж-фонда. Идея была в том, чтобы создавать вычислительные системы на графических процессорах (GPU) Nvidia. В 2021 году у компании уже было около 10 000 GPU, а к концу 2024-го она запустила свою первую генеративную модель искусственного интеллекта DeepSeek-V3, возможности которой были схожи с лидером рынка ChatGPT. 

По словам представителей DeepSeek, разработка модели обошлась им всего в $5,6 млн, а обучение заняло около двух месяцев, что крайне мало для этой индустрии: для сравнения, американские конкуренты на разработку модели с похожими характеристикам потратили около $60 млн. Кроме того, компании пришлось использовать урезанные ускорители, так как из-за американских санкций Nvidia не могла продавать Китаю полноценные современные GPU. 

Успех DeepSeek на фоне таких малых затрат даже обрушил акции Nvidia — компания потеряла $500 млрд капитализации, стоимость ее акций упала почти на 18%. Плохие новости для американских технокорпораций признал и вице-президент по продукту и росту в сфере искусственного интеллекта компании Dropbox Морган Браун. По его словам, стоимость обучения следующего за V3 поколения DeepSeek, R1, составила всего $5 млн против $100 млн, вложенных в конкурента китайской нейросети OpenAI. К тому же китайская модель требует в 50 раз меньше графических процессоров.

При этом по функционалу DeepSeek не отстает от конкурентов: чат-бот отвечает на вопросы пользователей и поддерживает беседу, может писать код, анализировать текст, искать и проверять информацию в интернете. Важно, что сервис полностью бесплатный, а его исходный код открытый — любой разработчик может на его базе создать собственный продукт. Из минусов — довольно жесткая цензура: модель отказывается отвечать на вопросы по некоторым спорным темам, включая отношение Китая к уйгурам, статус Тайваня и то, что произошло на площади Тяньаньмэнь в 1989 году.

Босс-гик

Коллеги описывают Ляна Вэньфэна как типичного китайского инженера: он не особо заботится о своем внешнем виде, принимает решения, только сверившись с формулами и расчетами, а еще — любит футбол. 

«Когда мы впервые встретились с ним, он был таким занудой с ужасной прической, который рассказывал о создании кластера из 10 000 чипов для обучения собственных моделей. Мы не воспринимали его всерьез», — рассказывает один из деловых партнеров Ляна. По его словам, тот даже не мог сформулировать, чего именно он хочет добиться, и говорил только, что это изменит правила игры.

Собеседники западных СМИ в отрасли рассказывают, что Вэньфэн — очень необычный для китайской индустрии искусственного интеллекта человек. Он обладает «как огромными знаниями в области инфраструктурной инженерии и моделирования, так и способностью мобилизовать ресурсы», а также «может принимать точные, высокоуровневые решения, при этом оставаясь сильнее передовых исследователей в деталях». И в то же время Вэньфэн совсем не похож на босса — «скорее, на гика», отмечают они.

Что дальше 

Внезапный бум популярности DeepSeek застал его основателя врасплох, признавался он сам в одном из интервью, но со знаменитого китайского рабочего ритма не сбил. После китайского Нового года (в этом году он пришелся на 29 января) Лян пообещал вернуться к работе над следующим поколением моделей DeepSeek. 

Есть у DeepSeek и более амбициозные планы: Вэньфэн заявил, что стремится создать полноценный AGI (Artificial General Intelligence, универсальный искусственный интеллект) — ИИ, который сможет мыслить и обучаться практически с теми же скоростью и качеством, как человек. «Это может быть два, пять или десять лет — в любом случае это произойдет при нашей жизни», — говорит основатель DeepSeek.

Вы уже оценили материал
Продолжайте читать

Объясняет ученый из Гарварда

Вы не «просто устали». Какой из семи типов отдыха вам нужен прямо сейчас

Разрешено законом, запрещено ВкусВиллом

Гид по пищевым добавкам: как торговая сеть определяет, что может содержаться в продуктах на полках

Гид по пищевым добавкам: как торговая сеть определяет, что может содержаться в продуктах на полках

Разрешено законом, запрещено ВкусВиллом

2025 — год рабочих профессий: как «синие воротнички» стали трендом

Бренды, медиа и инфлюенсеры переосмысливают образ человека, работающего руками

Бренды, медиа и инфлюенсеры переосмысливают образ человека, работающего руками

2025 — год рабочих профессий: как «синие воротнички» стали трендом