"Момент "Спутника". Как китайский чатбот DeepSeek встряхнул западную индустрию искусственного интеллекта и чем это ей грозит
Fоtо: Imago/Scanpix/LETA

На прошлой неделе китайский стартап DeepSeek запустил свой чатбот, похожий на популярный ChatGPT. Главное его достоинство, по словам разработчиков — гораздо меньшая стоимость оборудования и обучения по сравнению с конкурентами. К понедельнику DeepSeek обогнал ChatGPT по количеству загрузок из магазина приложений Apple в США, Великобритании и самом Китае.

Событие не то чтобы заурядное, но вроде и не судьбоносное. Тем не менее, на западных биржах в понедельник начался обвал, да еще какой: капитализация компаний, торгующихся на американском индексе высокотехнологических компаний Nasdaq, похудела на триллион долларов.

Лучше всего это описал Марк Андриссен, совладелец крупного венчурного фонда Andreessen Horowitz, назвав случившееся "моментом "Спутника"", имея в виду запуск первого космического аппарата Советским Союзом в 1957 году, открывшего миру истинное состояние советской науки в этой области.

Обвал на рынках

В понедельник инвесторы распродавали акции технологических компаний как горячие пирожки.

Индекс Nasdaq, где торгуются акции "техно-братии" — Meta, Alphabet, Nvidia, Apple и других технологических гигантов, — упал на 3,1%. Больше всех пострадала Nvidia, еще на прошлой неделе бывшая крупнейшей компанией мира по капитализации. Ее акции рухнули на 17%, она потеряла почти 600 млрд долларов стоимости и вновь пропустила Apple на первое место.

Падение акций Nvidia стало крупнейшим в истории фондового рынка США, более чем в два раза превысив предыдущий однодневный рекорд, установленный ею же в сентябре прошлого года.

Alphabet, материнская компания Google, потеряла 100 млрд долларов, Microsoft отделался семью миллиардами. На 17% подешевел американский производитель чипов Broadcom.

В Азии одним из главных пострадавших оказался японской SoftBank Group, активно инвестирующий в технологические компании и стартапы. В Европе картину дополнила ASML, один из главных производителей оборудования для производства микрочипов.

Последние несколько лет Уолл-стрит пребывала в состоянии неподдельного восторга по поводу возможностей ИИ и последующей монетизации этих возможностей.

Не далее как в минувшую среду акции американских компаний, связанных с ИИ, резко выросли, стоило президенту Трампу объявить о планах частного сектора инвестировать 500 миллиардов долларов в инфраструктуру ИИ через совместное предприятие Stargate, которое будет строить дата-центры в Техасе и за его пределами и обещает создать 100 тысяч новых рабочих мест. Японский SoftBank тут же объявил о выделении 19 миллиардов долларов на финансирование Stargate, в него также вложились разработчик ChatGPT OpenAI и Oracle.

Паника на рынках рикошетом ударила и по энергетическим компаниям: дело в том, что для обучения и работы искусственный интеллект требует огромного количества энергии. По прогнозам Goldman Sachs, к концу десятилетия потребление энергии дата-центрами в мире удвоится.

Например, Google в октябре прошлого года подписал соглашение с компанией Kairos Power об использовании небольших ядерных реакторов для питания центров обработки данных искусственного интеллекта, а в марте компания Amazon заявила, что купит дата-центр на атомной энергии в штате Пенсильвания.

Почему столь бурная реакция?

О стартапе из Ханчжоу, стоящем за DeepSeek, по документам известно немного.

Его главный акционер — Лян Вэньфэн, соучредитель хедж-фонда High-Flyer. Как сообщается, Лян начал покупать чипы Nvidia в 2021 году, чтобы разрабатывать модели ИИ в качестве хобби, за которое платил его хедж-фонд. В 2023 году он основал компанию DeepSeek, базирующуюся в городе Ханчжоу на востоке Китая.

Недавно его видели на встрече, организованной премьер-министром Китая Ли Цянем, что, по мнению китаеведов, свидетельствует о растущем авторитете DeepSeek в индустрии ИИ.

В отличие от многих американских предпринимателей, занимающихся искусственным интеллектом, Лян также имеет опыт работы в сфере финансов.

Его хедж-фонд High-Flyer использует искусственный интеллект для анализа финансовых данных, с его помощью инвесторы вычисляют закономерности в поведении ценных бумаг. Такие хедж-фонды называются квантовыми; для принятия инвестиционных решений они используют статистические методы, математическое моделирование и компьютерные алгоритмы, не полагаясь на фундаментальный анализ и оценки людей.

В 2019 году High-Flyer стал первым квантовым хедж-фондом в Китае, которому удалось привлечь более 100 млрд юаней — примерно 13 млн долларов.

В декабре DeepSeek сообщил, что модель ИИ DeepSeek-V3, запущенная 10 января, использовала для обучения немного устаревшие и менее производительные чипы Nvidia H800.

А модель DeepSeek-R1, выпущенная на прошлой неделе, в зависимости от задачи обходится в 20-50 раз дешевле, чем модель o1 от OpenAI, говорится в сообщении на официальном аккаунте DeepSeek в WeChat.

"Момент "Спутника". Как китайский чатбот DeepSeek встряхнул западную индустрию искусственного интеллекта и чем это ей грозит
Fоtо: AP/Scanpix/LETA

Компания утверждает, что модель R1 превосходит модель o1-mini от OpenAI по "различным показателям", а исследование аналитиков Artificial Analysis признало, что по общему качеству она превосходит модели, разработанные Google, Meta и Anthropic.

DeepSeek утверждает, что разработка R1 обошлась в 5,6 млн долларов — по сравнению с западными аналогами это копейки. Например, в прошлом году Дарио Амодей, соучредитель компании Anthropic, занимающейся разработкой искусственного интеллекта, утверждал, что стоимость обучения продвинутых моделей сегодня лежит в диапазоне от 100 млн до 1 млрд долларов.

В интервью китайским СМИ Лян сказал, что "ИИ должен быть недорогим и доступным для всех". По его мнению, Китай отстает от США в этой сфере всего на год-два.

Сэм Альтман из OpenAI в понедельник в основном отмалчивался, но к вечеру написал в соцсети Х, что DeepSeek "впечатляет… особенно тем, что они предлагают за такую цену".

Правда, некоторые эксперты призывают относиться к этим цифрам с некоторым скепсисом, имея в виду давно замеченную за китайской статистикой тенденцию приукрашивать реальность. Например, ветеран-аналитик Джин Мюнстер, управляющий партнер американской инвестиционной компании Deepwater Asset Management, ставит под сомнение финансовые показатели, на которые ссылается DeepSeek, указывая, что проверить, субсидируется ли стартап и верны ли его данные, непросто.

Дэниэл Морган, менеджер Synovus Trust Company, владеющей почти миллионом акций Nvidia, считает панику на рынках в начале недели чрезмерной реакцией.

По словам Моргана, поскольку модель ИИ DeepSeek предназначена для использования на мобильных телефонах и ПК, а не в центрах обработки данных, она конкурирует с ChatGPT, Meta Platforms и Gemini от Alphabet, а "настоящие деньги в сфере ИИ — это чипы для дата-центров от таких компаний, как Nvidia, Advanced Micro Devices и Broadcom".

Но независимо от того, насколько правдивы цифры, представленные DeepSeek, нервозность в рядах ИИ-компаний подогревает и еще одно обстоятельство: компания утверждает, что ориентируется исключительно на исследования, а не на коммерческие продукты — сам чатбот DeepSeek не требует платной подписки, а исходный код можно скачать бесплатно.

Грубо говоря, если у вас есть несколько лишних миллионов и достаточно мощные компьютеры — вы можете создать на основе технологий DeepSeek собственный искусственный мозг. А если ваш собственный мозг достаточно хорош, то получившийся продукт может обойти конкурентов из Google, Microsoft или OpenAI, со всеми вытекающими для вас (и особенно для них) финансовыми последствиями.

Доктор Эндрю Дункан, директор по науке и инновациям британского Института Алана Тьюринга, считает, что разработка DeepSeek "действительно интересна", потому что она "демократизирует доступ" к передовым моделям ИИ. По схожему пути пошла компания Meta Марка Цукерберга со своей моделью Llama — но с несопоставимо большими затратами на разработку и доступом к самым передовым технологиям.

DeepSeek (если верить данным компании) обошелся малой кровью.

Восток против Запада?

DeepSeek утверждает, что для разработки своих моделей использовала меньшее количество менее производительных и более дешевых чипов, чем конкуренты. Если это так, то экономия налицо, а многомиллиардные расходы американских компаний на ИИ, которые в немалой степени и вызвали рекордный рост на рынке, вызывают вопросы.

По данным самой DeepSeek, компания разработала индивидуальные алгоритмы для создания своих моделей, используя чипы Nvidia H800. По некоторым оценкам, основатель компании Лян Вэньфэн сумел накопить около 50 тысяч чипов Н800 и А100, предшественников чипа Н100.

Мощные чипы Nvidia H100 были запрещены к экспорту в Китай с сентября 2022 года в связи с опасениями за национальную безопасность США. Nvidia вышла из положения, несколько снизив мощность Н100 для китайского рынка и назвав получившийся продукт H800. Но в октябре прошлого года под запрет попали и они.

О поставках самого мощного чипа Blackwell, представленного компанией в марте прошлого года, китайцам не приходится и мечтать, тем более что в нем нашли функциональные дефекты, да и весь его запас на 2025 год уже давно раскуплен.

Не прошло и полугода, как на рынке появился DeepSeek, создавший продвинутую модель ИИ без доступа к самым передовым технологиям. Неудивительно, что это вызвало вопросы, смогут ли западные страны, в первую очередь США, помешать стремительному росту китайского высокотехнологичного сектора, подкрепляемому огромными запасами редкоземельных металлов, необходимых для его развития.

Ажиотаж вокруг искусственного интеллекта привел к огромному притоку капитала в акции за последние пару лет, взвинтив оценки стоимости компаний и подняв фондовые рынки на новые невиданные высоты.

Аналитики американского инвестиционного банка Goldman Sachs забили тревогу по поводу затрат на ИИ в прошлом году, опубликовав в июне заметку под заголовком "Gen AI: слишком много затрат, слишком мало пользы?", в которой задают вопрос, окупятся ли когда-нибудь инвестиции в ИИ в размере 1 трлн долларов в ближайшие несколько лет.

"Внезапно встал вопрос о том, нуждаются ли сотни миллиардов долларов инвестиций в ИИ в переоценке", — заявил Ричард Хантер, глава отдела рынков на платформе Interactive Investor.

Эндрю Дункан из Института Тьюринга сказал: "Это демонстрирует, что с относительно небольшими моделями и ресурсами можно делать удивительные вещи. Это показывает, что можно внедрять инновации, не имея таких огромных ресурсов, как, например, OpenAI".

"Я думаю, что это бросает вызов идее стратегии монетизации, которой придерживались многие ведущие американские компании в области ИИ, — считает Кайла Бломквист, научная сотрудница Оксфордского института интернета и директор Оксфордской лаборатории китайской политики. — Это указывает на потенциальные методы разработки гораздо менее ресурсоемких моделей, что потенциально может означать смену подхода, хотя насколько это так — нам еще предстоит узнать. Посмотрим, что принесут следующие пару месяцев".

А Дональд Трамп уже заявил, что достижения китайской индустрии ИИ могут быть "положительным фактором" для США и его не беспокоит появление DeepSeek — он уверен, что США останутся доминирующим игроком в этой области.

Что умеет DeepSeek?

Говоря по-простому, DeepSeek — это чатбот на базе ИИ, как ChatGPT или Copilot, созданный, как утверждают его авторы, чтобы "отвечать на ваши вопросы и эффективно улучшать вашу жизнь".

Внешне DeepSeek мало отличается от других чатботов. Как и в ChatGPT от OpenAI или Gemini от Google, вы открываете приложение (или сайт) и задаете ему вопросы о чем угодно, а он вам отвечает.

Часто чатбот начинает свой ответ со слов о том, что тема "крайне субъективна" — будь то политика (хорош ли Дональд Трамп в качестве президента США?) или безалкогольные напитки (что вкуснее, Pepsi или Coke?).

Но модель искусственного интеллекта, на которой оно основано, под названием R1, имеет около 670 миллиардов параметров. Как считает Анил Анантасвами, автор книги Why Machines Learn: The Elegant Math Behind Modern AI, это делает DeepSeek самой большой моделью языка с открытым исходным кодом.

По первым оценкам, в области математики, кодирования и общих рассуждений она не уступает модели o1 от OpenAI, на которой работает ChatGPT.

Как и многие другие китайские модели ИИ — Ernie от Baidu или Doubao от ByteDance — DeepSeek неохотно отвечает на вопросы, которые китайская Компартия считает неудобными или запретными, но, что удивительно, многое тут зависит от того, на каком языке задан вопрос.

Например, ответ на вопрос "Является ли Россия демократическим государством" выглядит примерно одинаково и по-русски, и по-украински, и по-английски.

"Момент "Спутника". Как китайский чатбот DeepSeek встряхнул западную индустрию искусственного интеллекта и чем это ей грозит
Fоtо: BBC

Столь же пространно DeepSeek отвечает и на вопросы о войне в Украине. Например, ответ на вопрос "Кто виноват в начале войны России против Украины?" начинается словами "Вопрос о том, кто виноват в начале войны России против Украины, является сложным и зависит от точки зрения, исторического контекста и интерпретации событий".

А вот ответ на вопрос "Что произошло на площади Тяньаньмэнь в 1989 году?" на русском языке выглядит так:

"Момент "Спутника". Как китайский чатбот DeepSeek встряхнул западную индустрию искусственного интеллекта и чем это ей грозит
Fоtо: BBC

А на английском — "Извините, это выходит за рамки моих возможностей. Давайте поговорим о чем-нибудь другом".

"Момент "Спутника". Как китайский чатбот DeepSeek встряхнул западную индустрию искусственного интеллекта и чем это ей грозит
Fоtо: BBC

Читайте нас там, где удобно: Facebook Telegram Instagram !