Image

Три вещи, которые нужно знать, когда пыль от DeepSeek уляжется

Поскольку первоначальный ажиотаж утихает, вот вероятные долгосрочные последствия.

На этой фотоиллюстрации логотип Deepseek виден через увеличительную лупу на экране мобильного телефона 29 января 2025 года в Лондоне, Англия.

Леон Нил/Getty

Эта статья первоначально была опубликована в «Алгоритме», нашей еженедельной рассылке об искусственном интеллекте. Чтобы первыми получать подобные статьи, подпишитесь здесь.

Запуск одной новой модели искусственного интеллекта обычно не вызывает особого ажиотажа за пределами технологических кругов и не пугает инвесторов настолько, чтобы обрушить фондовый рынок на 1 триллион долларов. Теперь, спустя пару недель после громкого события DeepSeek, страсти немного улеглись. Новостной цикл переключился на более спокойные события, такие как сворачивание давних федеральных программ США, уничтожение исследований и наборов данных в соответствии с недавними указами президента и возможные последствия новых пошлин президента Трампа для Канады, Мексики и Китая.

Но какое влияние DeepSeek, вероятно, окажет в долгосрочной перспективе на развитие искусственного интеллекта? Вот три семени, посеянных DeepSeek, которые прорастут, даже когда первоначальный ажиотаж утихнет.

Во-первых, это подталкивает к дискуссии о том, сколько энергии модели ИИ могут себе позволить использовать для поиска лучших ответов.

Возможно, вы слышали (в том числе и от меня), что DeepSeek энергоэффективен. Это верно для фазы обучения, но для вывода, когда вы спрашиваете модель о чём-то, и она выдаёт ответ, это сложно. В нём используется метод цепочки мыслей, который разбивает сложные вопросы — например, можно ли лгать, чтобы защитить чьи-то чувства — на части, а затем логически отвечает на каждый из них. Этот метод позволяет таким моделям, как DeepSeek, лучше справляться с математикой, логикой, программированием и другими задачами.

Проблема, по крайней мере для некоторых, заключается в том, что такой способ «мышления» потребляет гораздо больше электроэнергии, чем привычный нам ИИ. Хотя сейчас ИИ отвечает за небольшую долю общих глобальных выбросов, растёт политическая поддержка радикального увеличения объёма энергии, направляемой на ИИ. Оправдана ли энергоёмкость моделей цепочки мыслей, конечно, зависит от того, для чего мы используем ИИ. Научные исследования, направленные на лечение самых страшных болезней в мире, кажутся стоящими. Генерация ИИ-отбросов? В меньшей степени.

Некоторые эксперты опасаются, что впечатляющий потенциал DeepSeek приведет к тому, что компании начнут встраивать его во множество приложений и устройств, а пользователи будут искать его в сценариях, где это не требуется. (Просить DeepSeek объяснить теорию относительности Эйнштейна, например, пустая трата времени, поскольку для этого не требуется логических рассуждений, а любая типичная модель чата на основе искусственного интеллекта может сделать это с меньшими затратами времени и энергии.) Подробнее об этом читайте здесь.

Во-вторых, DeepSeek добилась некоторых творческих улучшений в методах обучения, и другие компании, вероятно, последуют ее примеру.

Продвинутые модели ИИ обучаются не только на обилии текста, изображений и видео. Они активно полагаются на людей, которые обрабатывают эти данные, аннотируют их и помогают ИИ выбирать более точные ответы, зачастую за мизерную плату.

Одним из способов участия человека в процессе является метод, называемый обучением с подкреплением и обратной связью. Модель генерирует ответ, оценщики оценивают этот ответ, и эти оценки используются для улучшения модели. Компания OpenAI стала пионером этого метода, хотя сейчас он широко используется в отрасли.

Как сообщает мой коллега Уилл Дуглас Хевен, DeepSeek поступил иначе: он нашёл способ автоматизировать процесс оценки и обучения с подкреплением. «Отказ от человеческой обратной связи или её сокращение — это очень важно», — сказал ему Итамар Фридман, бывший директор по исследованиям в Alibaba, а ныне соучредитель и генеральный директор Qodo, стартапа по программированию ИИ в Израиле. «Вы практически полностью обучаете модели без участия человека».

Это особенно хорошо работает для таких предметов, как математика и программирование, но не так хорошо для других, поэтому от сотрудников по-прежнему ждут помощи. Тем не менее, DeepSeek пошла ещё дальше и использовала методы, напоминающие те, которые Google DeepMind обучила свою модель искусственного интеллекта в 2016 году, чтобы добиться успеха в игре го, по сути, заставив её планировать возможные ходы и оценивать их результаты. Эти шаги, особенно учитывая, что они подробно описаны в открытой документации DeepSeek, несомненно, будут реализованы и другими компаниями. Подробнее о Уилле Дугласе Хевене читайте здесь.

Что такое ИИ? Читать далее

В-третьих, его успех станет поводом для ключевой дискуссии: можно ли одновременно добиваться того, чтобы исследования в области ИИ были открыты для всеобщего обозрения, и повышать конкурентоспособность США по сравнению с Китаем?

Задолго до того, как DeepSeek выпустила свою модель бесплатно, некоторые компании, занимающиеся разработкой ИИ, утверждали, что отрасль должна быть открытой книгой. Если исследователи будут придерживаться определённых принципов открытого исходного кода и демонстрировать свою работу, то, по их мнению, глобальная гонка за создание сверхразумного ИИ может рассматриваться как научный проект, направленный на общественное благо, а влияние любого участника будет ограничено другими участниками.

Хорошая идея. Meta в целом поддержала эту концепцию, а венчурный капиталист Марк Андрессен заявил, что подходы с открытым исходным кодом могут быть эффективнее для обеспечения безопасности ИИ, чем государственное регулирование. OpenAI придерживается противоположной точки зрения, сохраняя свои модели закрытыми, утверждая, что это поможет защитить их от злоумышленников.

DeepSeek немного запутал эти интерпретации. «Мы оказались на неправильной стороне истории и должны разработать другую стратегию в отношении открытого исходного кода», — заявил Сэм Альтман из OpenAI в пятницу в сессии вопросов и ответов на Reddit, что удивительно, учитывая позицию OpenAI в прошлом. Другие, включая президента Трампа, ещё раз подчеркнули необходимость повышения конкурентоспособности США в области ИИ, восприняв успех DeepSeek как сигнал к действию. Дарио Амодеи, основатель Anthropic, заявил, что это напоминание о том, что США необходимо строго контролировать, какие типы передовых чипов будут поступать в Китай в ближайшие годы, и некоторые законодатели продвигают ту же точку зрения.

Ближайшие месяцы и будущие запуски DeepSeek и других компаний подвергнут каждый из этих аргументов стрессовому испытанию.

Теперь прочитайте остальную часть Алгоритма.

Более глубокое обучение

OpenAI запускает исследовательский инструмент

В воскресенье OpenAI запустил инструмент Deep Research. Вы можете задать ему сложный вопрос для анализа, и он потратит до 30 минут на чтение источников, сбор информации и составление отчёта. Это совершенно новый инструмент, и мы ещё не тестировали качество его результатов. Поскольку вычисления занимают много времени (и, следовательно, энергии), сейчас он доступен только пользователям платной версии OpenAI Pro (200 долларов в месяц) и имеет ограничение на количество запросов в месяц.

Почему это важно: Компании, занимающиеся разработкой ИИ, конкурируют за создание полезных «агентов», которые могут выполнять действия от вашего имени. 23 января OpenAI запустила агента под названием Operator, который может использовать ваш компьютер для таких задач, как бронирование ресторанов или поиск вариантов авиабилетов. Новый исследовательский инструмент свидетельствует о том, что OpenAI не просто пытается немного упростить эти обыденные онлайн-задачи; компания стремится позиционировать ИИ как инструмент для решения профессиональных исследовательских задач. Компания утверждает, что Deep Research «за десятки минут выполняет то, на что у человека ушли бы многие часы». Время покажет, оправдают ли пользователи высокие затраты и риск включения неверной информации. Читайте также: Рианнон Уильямс.

Биты и байты

Дежавю: Илон Маск применяет свою тактику захвата Twitter в Вашингтоне

Федеральные агентства предлагали увольнения миллионам сотрудников и проверяли мастерство инженеров — точно так же, как Илон Маск купил Twitter. Сходство поразительное. (The New York Times)

Использование ИИ в искусстве и кино получило поддержку от Бюро по авторским правам

Бюро по авторским правам США считает, что произведения искусства, созданные с помощью ИИ, в большинстве случаев должны подпадать под защиту авторских прав в соответствии с действующим законодательством, но работы, полностью созданные с помощью ИИ, вероятно, не подлежат защите. Что это будет означать? (The Washington Post)

OpenAI выпускает бесплатно свою новую модель рассуждений o3-mini

OpenAI только что выпустила модель рассуждений, которая быстрее, дешевле и точнее своей предшественницы. (MIT Technology Review)

Anthropic предлагает новый способ защиты больших языковых моделей от джейлбрейков

Эта линия обороны может оказаться самой прочной на сегодняшний день. Но ни один щит не идеален. (MIT Technology Review).

Источник: www.technologyreview.com

✅ Найденные теги: новости, Три

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых