Китайская нейросеть DeepSeek всего за пару недель обрела всемирную популярность: ее приложение в считанные дни вышло на первое место в App Store. И даже внезапно обрушила акции крупнейших технологических корпораций. Это пример очень стремительной истории успеха. Всего месяц назад мало кто за пределами Китая знал о существовании этой компании, а о ее основателе — еще меньше. Рассказываем, кто стоит за созданием самой популярной нейросети 2025 года и почему мировые СМИ уже называют этого человека «китайским Сэмом Альтманом».
О жизни Ляна Вэньфэна известно не так много — до января 2025 года он дал всего два небольших интервью китайским журналистам (первое, второе). Родился будущий создатель DeepSeek в 1985 году в портовом городе Чжаньцзяне в китайской провинции Гуандун. В интервью местной прессе Вэньфэн говорил, что его отец был учителем начальной школы, американские СМИ утверждают, что его мать тоже преподавала детям. По словам самого Вэньфэна, родители привили ему любовь к учебе с детства: он всегда был круглым отличником, а в средней школе начал самостоятельно изучать математический анализ. Любопытство останется одной из главных черт характера Ляна и во взрослом возрасте: коллеги по DeepSeek будут отзываться от нем как о человеке с «ужасающей способностью к обучению».
После выпуска из школы в 2002 году Вэньфэн поступил в Чжэцзянский университет — один из старейших и самых престижных вузов Китая. Среди известных выпускников, например, Колин Хуан, основатель и бывший генеральный директор китайского гиганта электронной коммерции Pinduoduo. Вэньфэн получил степень бакалавра технических наук в области электронной информационной инженерии, а спустя три года стал магистром. Уже в 2008 году он был уверен, что искусственный интеллект изменит мир, хотя на тот момент мало кто разделял его мнение.
После окончания университета многие однокурсники Вэньфэна устроились программистами в технологические корпорации, но сам он пошел другим путем. Хотя предложения были: так, в начале 2010-х друг Вэньфэна Ван Тао приглашал его в свою команду по разработке летательных аппаратов в Шэньчжэне. Но Вэньфэн отказался, а Тао вскоре основал компанию DJI, ставшую крупнейшем разработчиком дронов в мире.
Вэньфэн переезжает в Чэнду и арендует там дешевую квартиру, которая также служит ему офисом. Там он начинает экспериментировать с искусственным интеллектом в сфере финансов: использует алгоритмы для создания торговых стратегий, прогнозирования тенденций и принятия инвестиционных решений. Инструмент, который разрабатывал Лян на своей кухне, должен был помочь частным инвесторам и компаниям торговать ценными бумагами на бирже.
В 2013 году Вэньфэн основал инвестиционную компанию Jacobi, которую назвал в честь немецкого математика Карла Якоби. А через два года вместе с двумя университетскими друзьями создал хедж-фонд High-Flyer, который к 2019 году уже управлял активами на сумму $10 млрд. Сегодня фонд считается одним из крупнейших в Китае.
Поначалу High-Flyer использовал уже существующие алгоритмы машинного обучения, а в октябре 2016 года создал первую собственную модель искусственного интеллекта. В это же время фонд произвел свой первый реальный торговый ордер, целиком сформированный ИИ: алгоритм сам купил или продал ценные бумаги без участия человека.
Уже к концу следующего года High-Flyer стала применять ИИ-расчеты практически во всех своих стратегиях: алгоритмы научились сами определять, когда покупать или продавать акции. В 2018 году компания получила премию Golden Bull Fund Award — одну из самых авторитетных наград в инвестиционной индустрии Китая.
В мае 2023 года Вэньфэн основал проект DeepSeek — сначала как ответвление от основного бизнеса хедж-фонда. Идея была в том, чтобы создавать вычислительные системы на графических процессорах (GPU) Nvidia. В 2021 году у компании уже было около 10 000 GPU, а к концу 2024-го она запустила свою первую генеративную модель искусственного интеллекта DeepSeek-V3, возможности которой были схожи с лидером рынка ChatGPT.
По словам представителей DeepSeek, разработка модели обошлась им всего в $5,6 млн, а обучение заняло около двух месяцев, что крайне мало для этой индустрии: для сравнения, американские конкуренты на разработку модели с похожими характеристикам потратили около $60 млн. Кроме того, компании пришлось использовать урезанные ускорители, так как из-за американских санкций Nvidia не могла продавать Китаю полноценные современные GPU.
Успех DeepSeek на фоне таких малых затрат даже обрушил акции Nvidia — компания потеряла $500 млрд капитализации, стоимость ее акций упала почти на 18%. Плохие новости для американских технокорпораций признал и вице-президент по продукту и росту в сфере искусственного интеллекта компании Dropbox Морган Браун. По его словам, стоимость обучения следующего за V3 поколения DeepSeek, R1, составила всего $5 млн против $100 млн, вложенных в конкурента китайской нейросети OpenAI. К тому же китайская модель требует в 50 раз меньше графических процессоров.
При этом по функционалу DeepSeek не отстает от конкурентов: чат-бот отвечает на вопросы пользователей и поддерживает беседу, может писать код, анализировать текст, искать и проверять информацию в интернете. Важно, что сервис полностью бесплатный, а его исходный код открытый — любой разработчик может на его базе создать собственный продукт. Из минусов — довольно жесткая цензура: модель отказывается отвечать на вопросы по некоторым спорным темам, включая отношение Китая к уйгурам, статус Тайваня и то, что произошло на площади Тяньаньмэнь в 1989 году.
Коллеги описывают Ляна Вэньфэна как типичного китайского инженера: он не особо заботится о своем внешнем виде, принимает решения, только сверившись с формулами и расчетами, а еще — любит футбол.
«Когда мы впервые встретились с ним, он был таким занудой с ужасной прической, который рассказывал о создании кластера из 10 000 чипов для обучения собственных моделей. Мы не воспринимали его всерьез», — рассказывает один из деловых партнеров Ляна. По его словам, тот даже не мог сформулировать, чего именно он хочет добиться, и говорил только, что это изменит правила игры.
Собеседники западных СМИ в отрасли рассказывают, что Вэньфэн — очень необычный для китайской индустрии искусственного интеллекта человек. Он обладает «как огромными знаниями в области инфраструктурной инженерии и моделирования, так и способностью мобилизовать ресурсы», а также «может принимать точные, высокоуровневые решения, при этом оставаясь сильнее передовых исследователей в деталях». И в то же время Вэньфэн совсем не похож на босса — «скорее, на гика», отмечают они.
Внезапный бум популярности DeepSeek застал его основателя врасплох, признавался он сам в одном из интервью, но со знаменитого китайского рабочего ритма не сбил. После китайского Нового года (в этом году он пришелся на 29 января) Лян пообещал вернуться к работе над следующим поколением моделей DeepSeek.
Есть у DeepSeek и более амбициозные планы: Вэньфэн заявил, что стремится создать полноценный AGI (Artificial General Intelligence, универсальный искусственный интеллект) — ИИ, который сможет мыслить и обучаться практически с теми же скоростью и качеством, как человек. «Это может быть два, пять или десять лет — в любом случае это произойдет при нашей жизни», — говорит основатель DeepSeek.
«Магическая четверка» приемов от специалиста по развитию стартапов Артура Бит-Саргиза
Психолог Маргарита Даревская о том, как быть, если вам всегда все не нравится
Профессор Йельского университета Лори Сантос о том, как гарантированно повысить удовлетворенность жизнью