Встречайте DeepSeek: стартап в области искусственного интеллекта, который только что превзошел ChatGPT!

Китайский стартап, которому всего год, производит сенсацию в секторе искусственного интеллекта, представляя чат-бота, который соответствует эффективности ChatGPT, но требует значительно меньше затрат на электроэнергию, охлаждение и обучение по сравнению с системами, разработанными OpenAI, Google и Anthropic. Вот обзор моделей Deepseek V3 и R1 и почему эта компания может кардинально изменить стратегии Америки в области искусственного интеллекта.

Что такое DeepSeek?

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., часто называемая просто DeepSeek, — китайский технологический стартап в области ИИ. Первоначально созданная как исследовательское подразделение ИИ в High-Flyer Corporation в апреле 2023 года, она была позже выделена в отдельную организацию в мае того же года, при этом High-Flyer сохранила инвестиционные права. Одновременно DeepSeek представила свою модель второго поколения, DeepSeek-V2, которая продемонстрировала сопоставимую производительность с ведущими китайскими компаниями в области ИИ, такими как ByteDance, Tencent и Baidu, но при этом имела значительно более низкие эксплуатационные расходы.

В декабре 2024 года компания запустила модель V3, которая, как говорят, была обучена менее чем за 2 месяца с использованием огромного количества параметров в 671 миллиард. Интересно, что, согласно последней оценке Джеффриса, стоимость обучения DeepSeek V3 составила около 5,6 миллионов долларов, что делает ее значительно дешевле, чем Llama от Meta, при этом стоимость обучения составила менее 10%. Это заметно ниже по сравнению с сотнями миллионов или миллиардами долларов, которые американские компании, такие как Google, Microsoft, xAI и OpenAI, потратили на обучение своих моделей.

Представляем DeepSeek-V3!
Значительное улучшение:
* Ускорено до 60 токенов в секунду (в три раза быстрее, чем у предшественника V2!)
* Усилены возможности
* Продолжение совместимости с API
* Модели с открытым исходным кодом и исследовательские работы доступны для всех
1/n
— DeepSeek (@deepseek_ai) 26 декабря 2024 г.

Результаты испытаний показывают, что эффективность V3 сопоставима с эффективностью GPT-4o и Claude 3.5 Sonnet. В статье, опубликованной в The Hill в декабре 2024 года, достижение DeepSeek было названо важной вехой или «моментом американского спутника».

В ноябре 2024 года DeepSeek представила свою модель R1-Lite-Preview, которая может похвастаться своей способностью превзойти серию моделей рассуждений OpenAI O1 при значительно меньших затратах. По словам DeepSeek, модель R1 в 20–50 раз дешевле в эксплуатации по сравнению с O1, в зависимости от задачи. После этого выпуска DeepSeek представила DeepSeek-R1 и DeepSeek-R1-Zero в январе 2025 года. В отличие от своего аналога, модель R1 является продуктом с открытым исходным кодом, что позволяет разработчикам использовать ее свободно.

С момента своего дебюта DeepSeek’s V3 AI Assistant и его сопутствующее приложение R1 получили огромное признание и признание. Фактически, они свергли ChatGPT с трона ведущих приложений в магазинах приложений. В частности, венчурный капиталист Марк Андреесен выразил свое восхищение чат-ботом DeepSeek в социальных сетях, назвав его «одним из самых замечательных и внушающих благоговение инноваций, с которыми я когда-либо сталкивался» и «драгоценным вкладом в человечество».

Что может DeepSeek?

С моей точки зрения как наблюдателя, я считаю, что возможности чат-ботов DeepSeek удивительно похожи на возможности таких моделей, как ChatGPT, Gemini и Claude. Они преуспевают в различных областях, таких как генерация текста, создание аудио, создание изображений и синтез видео. DeepSeek выделяется своими недавно запущенными мультимодальными моделями Janus Pro, которые, как сообщается, превосходят DALL-E 3 и несколько других моделей, таких как PixArt-alpha, Emu3-Gen и Stable Diffusion XL, по двум основным отраслевым показателям.

DeepSeek-R1, модель, которая конкурирует с o1, специально разработана для решения сложных задач рассуждения. Она не только решает проблемы, но и разбивает процесс на четкие шаги, обеспечивая логическую последовательность мыслей при решении проблемы, делая ее мыслительный процесс прозрачным и понятным.

о боже #deepseek
— Алексиос Манцарлис (@mantzarlis.com) 2025-01-27T16:50:40.640Z

Модели искусственного интеллекта DeepSeek не предназначены для обсуждения таких деликатных тем, как площадь Тяньаньмэнь, протесты «Желтых зонтиков» или сравнения президента Си Цзиньпина с Винни-Пухом. По сути, они избегают любых тем, которые Коммунистическая партия Китая считает запретными, воздерживаясь от участия в содержательном диалоге по этим темам.

Кто может использовать DeepSeek?

С моделью открытого исходного кода DeepSeek разработчики могут использовать ее бесплатно — в отличие от подписки Pro от OpenAI, которая обойдется вам в 200 долларов в месяц. Чтобы использовать DeepSeek, просто создайте бесплатную учетную запись на их веб-сайте. Однако из-за наплыва вредоносных кибератак регистрация новых пользователей временно приостановлена. Текущие пользователи могут продолжать использовать платформу как обычно, но пока нет информации о том, когда новые пользователи получат доступ.

Почему DeepSeek вдруг стал таким важным событием?

После запуска ChatGPT в ноябре 2023 года американские корпорации ИИ были активно заняты созданием более крупных, более мощных и ресурсоемких больших языковых моделей. Вместо того чтобы стремиться к более доступным и энергосберегающим LLM, такие компании, как OpenAI, Microsoft, Anthropic и Google, решили ускорить рост технологии, инвестируя огромные суммы капитала и ресурсов, что является типичным американским подходом. В 2024 году ожидалось, что генеральный директор xAI Илон Маск лично вложит более 10 миллиардов долларов в проекты ИИ. OpenAI и ее партнеры представили инициативу Project Stargate стоимостью 500 миллиардов долларов, которая направлена на ускорение создания объектов зеленой энергетики и центров обработки данных ИИ по всей стране в США. По словам генерального директора Сундара Пичаи, Google намерена значительно расширить платформу Gemini в течение 2025 года и, как ожидается, потратит миллиарды долларов в этом году на достижение этой цели. В середине января Meta сообщила, что выделит до 65 миллиардов долларов в этом году на разработку ИИ.

Как энтузиаст технологий, я недавно обнаружил, что DeepSeek вызвал удивление своими новаторскими открытиями. Похоже, что «бум ИИ», который мы переживаем в последнее время и который значительно усилил американские компании, такие как Nvidia, и подпитывал нашу экономику, мог быть иллюзией с самого начала. Это открытие ставит под сомнение, действительно ли США лидируют в области технологий ИИ, несмотря на наши строгие экспортные ограничения на передовые графические процессоры, отправленные в Китай за последний год.

Кит Лернер, аналитик Truist, заявил CNN: Превосходные показатели США в первую очередь обусловлены технологическими отраслями и преимуществом американских компаний в области искусственного интеллекта. Однако выпуск модели DeepSeek заставил инвесторов задуматься о том, сохранят ли американские компании свое преимущество, сколько они инвестируют и принесут ли эти инвестиции прибыль или приведут к чрезмерным расходам.

По сути, DeepSeek превзошел сектор ИИ в США, создав высококонкурентную модель с меньшими ресурсами, бросив вызов идее о том, что постоянное расширение необходимо. Как заявил Срини Паджури, аналитик Raymond James, в интервью CNBC, «DeepSeek, похоже, не имеет доступа к такому количеству вычислительной мощности, как американские гиперскейлеры, и тем не менее разработал высококонкурентную модель». Если китайский стартап может создать модель ИИ, равную топовой модели OpenAI, менее чем за 6 миллионов долларов, это поднимает вопросы о значимости таких фигур, как Сэм Альтман, в отрасли.

Время покажет, представляет ли DeepSeek реальную угрозу — конкуренция становится все более напряженной, поскольку исследователи определяют эффективные технологии, а западные державы адаптируют и развивают свои стратегии, считает Майкл Блок, рыночный стратег Third Seven Capital. Он предполагает, что рынки могли быть слишком расслаблены в начале второго срока Трампа и жаждали причин для отступления, найдя в данном случае убедительную.

Смотрите также

2025-01-27 23:28