Что такое DeepSeek и почему он взорвал сектор искусственного интеллекта?

27.01.2025

Существующий технологический миропорядок оказался под угрозой после того, как китайский стартап DeepSeek представил новый бот с искусственным интеллектом, который при существенно меньших затратах способен конкурировать с лидирующими американскими разработками, а в чем-то и превосходит их, пишет Reuters.

Компания привлекла внимание мирового сообщества в сфере ИИ после публикации исследования в декабре, где были раскрыты затраты на обучение DeepSeek-V3: стоимость использованных вычислительных мощностей на базе чипов Nvidia H800 составила менее $6 миллионов.

ИИ-помощник DeepSeek в понедельник обогнал своего конкурента ChatGPT и занял первую строчку по числу загрузок среди бесплатных приложений в магазине App Store Apple в Соединенных Штатах.

Это поставило под сомнение обоснованность решений некоторых американских технологических компаний инвестировать миллиарды долларов в искусственный интеллект, что привело к падению акций ряда крупных технологических игроков, включая Nvidia.

В ЧЕМ ПРИЧИНА АЖИОТАЖА ВОКРУГ DEEPSEEK?

После того как OpenAI вывела на рынок чат-бот ChatGPT в конце 2022 года, китайские технологические компании начали наперегонки разрабатывать собственных ботов с использованием ИИ.

Однако выпуск первого китайского аналога ChatGPT, созданного гигантом поисковых систем Baidu, вызвал массовое разочарование в Китае из-за существенного разрыва в возможностях искусственного интеллекта между американскими и китайскими компаниями.

В случае с DeepSeek это не так: по сведениям китайского стартапа, две модели — DeepSeek-V3 и DeepSeek-R1, получившие высокую оценку как от руководителей Кремниевой долины, так и от инженеров американских технологических компаний, не уступают самым передовым моделям от OpenAI и Meta.

Использование этих моделей также экономически выгоднее. Согласно сообщению в официальном аккаунте DeepSeek в соцсети WeChat, представленная на прошлой неделе модель DeepSeek-R1 в зависимости от задачи требует в 20-50 раз меньше затрат, чем модель o1 от OpenAI.

Однако некоторые открыто скептичны в отношении DeepSeek.

Генеральный директор Scale AI Александр Ван сказал в интервью CNBC, что DeepSeek располагает 50 000 чипами Nvidia H100, однако не представил доказательств. По его мнению, компания скрывает этот факт, поскольку он свидетельствовал бы о нарушении установленного Вашингтоном запрета на продажу подобных передовых чипов для искусственного интеллекта китайским компаниям. DeepSeek не ответила немедленно на просьбу о комментарии по поводу данного обвинения.

Аналитики Bernstein в записке в понедельник подчеркнули, что общие затраты на обучение модели V3 компании DeepSeek неизвестны, но значительно превышают $5,58 миллиона, которые, как сообщил стартап, были потрачены на вычислительные мощности. Аналитики также отметили, что стоимость обучения столь же высоко оцененной модели R1 вообще не разглашается.

КТО СТОИТ ЗА DEEPSEEK?

DeepSeek — это базирующийся в Ханчжоу стартап, контрольным акционером которого, согласно китайским корпоративным документам, является Лян Вэньфэн, один из соучредителей хедж-фонда High-Flyer.

Фонд Лян Вэньфэна в марте 2023 года сообщил в своем официальном аккаунте в WeChat о переориентации с торговой деятельности на формирование новой независимой исследовательской группы, изучающей суть AGI (искусственного общего интеллекта). В том же году появился DeepSeek.

По определению OpenAI, разработчика ChatGPT, AGI представляет собой автономные системы, которые способны превзойти человека в выполнении большинства экономически важных задач.

Размер инвестиций High-Flyer в DeepSeek остается неизвестным. Согласно китайским корпоративным документам, High-Flyer имеет офис в том же здании, что и DeepSeek, а также владеет патентами на кластеры микросхем, используемые для обучения моделей искусственного интеллекта.

В июле 2022 года подразделение искусственного интеллекта High-Flyer опубликовало в своем официальном аккаунте WeChat информацию о владении и эксплуатации кластера, состоящего из 10000 чипов A100.

КАК ПЕКИН ОТНОСИТСЯ К DEEPSEEK?

Успех DeepSeek уже заметили в высших политических кругах Китая. По информации государственного информационного агентства Синьхуа, 20 января, в день публичного запуска DeepSeek-R1, основатель компании Лян Вэньфэн участвовал в закрытом симпозиуме для предпринимателей и экспертов под председательством премьер-министра Китая Ли Цяна.

Присутствие Ляна на этом мероприятии может указывать на то, что успех DeepSeek играет важную роль в политике КНР, направленной на преодоление экспортных ограничений Вашингтона и достижение независимости в стратегических отраслях, включая искусственный интеллект.

На аналогичном симпозиуме в 2024 году присутствовал генеральный директор Baidu Робин Ли.