Image

DeepSeek: все, что вам нужно знать о приложении чат-бота на основе искусственного интеллекта

Значок приложения DeepSeek на мобильном телефоне
Авторы изображений: ГРЕГ БЕЙКЕР/AFP / Getty Images

DeepSeek стал вирусным.

Китайская лаборатория искусственного интеллекта DeepSeek на этой неделе ворвалась в сознание широких масс после того, как её чат-бот возглавил рейтинги Apple App Store (и Google Play). Модели искусственного интеллекта DeepSeek, обученные с использованием высокопроизводительных вычислительных методов, заставили аналитиков и технических специалистов с Уолл-стрит усомниться в том, смогут ли США сохранить лидерство в гонке за ИИ и сохранится ли спрос на ИИ-чипы.

Но откуда появился DeepSeek и как он так быстро завоевал международную известность?

Происхождение трейдера DeepSeek

DeepSeek поддерживается High-Flyer Capital Management, китайским количественным хедж-фондом, который использует ИИ для принятия торговых решений.

Энтузиаст искусственного интеллекта Лян Вэньфэн стал соучредителем High-Flyer в 2015 году. Вэньфэн, который, как сообщается, начал заниматься трейдингом, будучи студентом Чжэцзянского университета, в 2019 году запустил High-Flyer Capital Management как хедж-фонд, сосредоточенный на разработке и внедрении алгоритмов искусственного интеллекта.

В 2023 году компания High-Flyer основала DeepSeek как лабораторию, занимающуюся исследованиями инструментов искусственного интеллекта, отдельно от финансового бизнеса. Благодаря участию High-Flyer в качестве одного из инвесторов, лаборатория выделилась в отдельную компанию, также названную DeepSeek.

С самого начала компания DeepSeek создавала собственные кластеры в центрах обработки данных для обучения моделей. Однако, как и другие китайские компании, занимающиеся разработкой искусственного интеллекта, DeepSeek пострадала от запретов США на экспорт оборудования. Для обучения одной из своих последних моделей компания была вынуждена использовать чипы Nvidia H800 — менее мощную версию чипа H100, доступного американским компаниям.

Говорят, что техническая команда DeepSeek в основном состоит из молодых специалистов. Компания, как сообщается, активно набирает исследователей в области искусственного интеллекта с докторской степенью из ведущих китайских университетов. DeepSeek также нанимает людей без опыта работы в области компьютерных наук, чтобы помочь своим техническим специалистам лучше разбираться в широком спектре тем, сообщает The New York Times.

Сильные модели DeepSeek

DeepSeek представил свой первый набор моделей — DeepSeek Coder, DeepSeek LLM и DeepSeek Chat — в ноябре 2023 года. Но только прошлой весной, когда стартап выпустил семейство моделей следующего поколения DeepSeek-V2, индустрия ИИ начала обращать на них внимание.

DeepSeek-V2, универсальная система анализа текста и изображений, показала хорошие результаты в различных бенчмарках искусственного интеллекта и была значительно дешевле в эксплуатации, чем аналогичные модели того времени. Это вынудило внутренних конкурентов DeepSeek, включая ByteDance и Alibaba, снизить стоимость использования некоторых своих моделей и сделать другие полностью бесплатными.

DeepSeek-V3, запущенный в декабре 2024 года, только добавил известности DeepSeek.

По данным внутреннего тестирования DeepSeek, DeepSeek V3 превосходит как загружаемые, общедоступные модели, такие как Llama от Meta, так и «закрытые» модели, доступ к которым возможен только через API, такие как GPT-4o от OpenAI.

Не менее впечатляющей является и модель «рассуждений» R1 от DeepSeek. DeepSeek, выпущенная в январе, утверждает, что R1 не уступает модели o1 от OpenAI по ключевым показателям производительности.

Будучи моделью рассуждений, R1 эффективно проверяет сам себя, что помогает ей избегать некоторых ловушек, с которыми обычно сталкиваются модели. Модели рассуждений требуют немного больше времени — обычно на секунды или минуты — для принятия решений по сравнению с типичной моделью, не использующей рассуждения. Преимущество заключается в том, что они, как правило, более надёжны в таких областях, как физика, естественные науки и математика.

Однако у R1, DeepSeek V3 и других моделей DeepSeek есть и недостаток. Будучи разработанными в Китае искусственным интеллектом, они подлежат проверке со стороны китайского интернет-регулятора, чтобы гарантировать, что их ответы «воплощают основные социалистические ценности». Например, в чат-боте DeepSeek R1 не отвечает на вопросы о площади Тяньаньмэнь или автономии Тайваня.

В марте число посещений DeepSeek превысило 16,5 млн. «В марте DeepSeek занимает второе место, несмотря на падение трафика на 25% по сравнению с февралем, исходя из количества посещений в день», — рассказал TechCrunch Дэвид Карр, редактор Similarweb. Однако он всё ещё не идёт ни в какое сравнение с ChatGPT, чьё число еженедельно активных пользователей в марте превысило 500 млн.

В мае DeepSeek выпустила обновленную версию своей модели рассуждений ИИ R1 на платформе разработчиков Hugging Face.

В сентябре компания DeepSeek представила новую экспериментальную модель под названием V3.2-exp, разработанную для существенного снижения затрат на вывод при использовании в долгосрочных контекстных операциях.

Разрушительный подход

Если у DeepSeek и есть бизнес-модель, то какая именно, неясно. Компания устанавливает цены на свои продукты и услуги значительно ниже рыночных, а другие предоставляет бесплатно. Компания также не принимает деньги инвесторов, несмотря на огромный интерес венчурного капитала.

По данным DeepSeek, прорывы в области эффективности позволили компании поддерживать экстремальную ценовую конкурентоспособность. Однако некоторые эксперты оспаривают предоставленные компанией цифры.

Как бы то ни было, разработчики обратились к моделям DeepSeek, которые не являются моделями с открытым исходным кодом в общепринятом понимании, а доступны по разрешительным лицензиям, допускающим коммерческое использование. По словам Клема Деланга, генерального директора Hugging Face, одной из платформ, где размещаются модели DeepSeek, разработчики Hugging Face создали более 500 «производных» моделей R1, которые в общей сложности были загружены 2,5 миллиона раз.

Успех DeepSeek по сравнению с более крупными и авторитетными конкурентами был назван «переворачивающим с ног на голову ИИ» и «чрезмерно раздутым». Успех компании, по крайней мере, отчасти стал причиной падения акций Nvidia на 18% в январе и вызвал публичную реакцию генерального директора OpenAI Сэма Альтмана. В марте, по данным Reuters, бюро Министерства торговли США сообщили своим сотрудникам, что DeepSeek будет запрещён на правительственных устройствах.

Microsoft объявила о доступности DeepSeek на своём сервисе Azure AI Foundry — платформе Microsoft, объединяющей ИИ-сервисы для предприятий под одной крышей. Отвечая на вопрос о влиянии DeepSeek на расходы Meta на ИИ во время телефонной конференции по итогам первого квартала, генеральный директор Марк Цукерберг заявил, что расходы на ИИ-инфраструктуру останутся «стратегическим преимуществом» для Meta. В марте OpenAI назвала DeepSeek «субсидируемой государством» и «контролируемой государством» и рекомендовала правительству США рассмотреть вопрос о запрете моделей на DeepSeek.

Во время телефонной конференции Nvidia, посвященной финансовым результатам за четвертый квартал, генеральный директор Дженсен Хуанг подчеркнул «превосходную инновационность» DeepSeek, заявив, что она и другие «модели логического мышления» отлично подходят для Nvidia, поскольку ей требуется гораздо больше вычислительных мощностей.

В то же время некоторые компании, а также целые страны и правительства, включая Южную Корею, запрещают использование DeepSeek. Штат Нью-Йорк также запретил использование DeepSeek на правительственных устройствах.

В мае вице-председатель и президент Microsoft Брэд Смит заявил на слушаниях в Сенате, что сотрудникам Microsoft не разрешено использовать DeepSeek из-за проблем с безопасностью данных и пропагандой.

Что касается будущего DeepSeek, оно пока неясно. Улучшение моделей — это само собой разумеющееся. Однако правительство США, похоже, всё больше опасается того, что оно считает вредоносным иностранным влиянием. В марте The Wall Street Journal сообщила, что США, вероятно, запретят DeepSeek на правительственных устройствах.

Эта история была первоначально опубликована 28 января 2025 года и будет регулярно обновляться.

Источник: techcrunch.com

✅ Найденные теги: DeepSeek, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых