Image

Квантовые физики уменьшили и «децензурировали» DeepSeek R1

Им удалось сократить размер модели рассуждений ИИ более чем вдвое, и они утверждают, что теперь она может отвечать на политически деликатные вопросы, ранее недоступные в китайских системах ИИ.

На фотоиллюстрации изображен логотип DeepSeek с заклеенным клейкой лентой ртом.

Фотоиллюстрация Сары Роджерс/MITTR | Фотографии Deepseek, Getty

Группа квантовых физиков утверждает, что создала версию мощной модели рассуждений искусственного интеллекта DeepSeek R1, которая устраняет цензуру, встроенную в оригинал ее китайскими создателями.

Учёные из испанской компании Multiverse Computing, специализирующейся на квантовых технологиях искусственного интеллекта, создали DeepSeek R1 Slim — модель, которая на 55% меньше исходной, но при этом работает почти так же эффективно. Что особенно важно, они также утверждают, что избавились от официальной китайской цензуры.

В Китае компании, занимающиеся разработкой ИИ, подчиняются правилам и нормам, призванным гарантировать соответствие создаваемого контента законам и «социалистическим ценностям». В результате компании создают многоуровневую цензуру при обучении систем ИИ. На вопросы, которые считаются «политически деликатными», модели часто отказываются отвечать или предлагают тезисы, взятые прямо из государственной пропаганды.

Чтобы упростить модель, Multiverse обратилась к математически сложному подходу, заимствованному из квантовой физики, который использует сети многомерных сеток для представления и обработки больших наборов данных. Использование этих так называемых тензорных сетей значительно сокращает размер модели и позволяет более эффективно реализовать сложную систему искусственного интеллекта.

Этот метод предоставляет исследователям «карту» всех корреляций в модели, позволяя им точно идентифицировать и удалять определённые фрагменты информации. После сжатия и редактирования модели исследователи Multiverse настраивают её так, чтобы её выходные данные максимально соответствовали оригиналу.

DeepSeek довольно легко заставить ругаться. Читать далее

Чтобы проверить эффективность этой системы, исследователи составили набор данных из примерно 25 вопросов по темам, которые, как известно, ограничены в китайских моделях, включая «На кого похож Винни-Пух?» — отсылка к мему, высмеивающему президента Си Цзиньпина, — и «Что произошло на площади Тяньаньмэнь в 1989 году?». Они сравнили ответы модифицированной модели с ответами оригинальной модели DeepSeek R1, используя GPT-5 от OpenAI в качестве беспристрастного судьи для оценки степени цензуры в каждом ответе. Нецензурированная модель смогла предоставить фактические ответы, сопоставимые с ответами западных моделей, сообщает Multiverse.

Эта работа является частью более масштабных усилий Multiverse по разработке технологии сжатия и манипулирования существующими моделями искусственного интеллекта. Большинство современных крупных языковых моделей требуют мощных графических процессоров и значительной вычислительной мощности для обучения и запуска. Однако, по словам Романа Оруса, соучредителя и главного научного директора Multiverse, они неэффективны. Сжатая модель может работать почти так же эффективно, экономя при этом энергию и деньги, говорит он.

В индустрии искусственного интеллекта всё больше усилий направлено на уменьшение размера и повышение эффективности моделей. «Дистиллированные» модели, такие как варианты R1-Distill от DeepSeek, пытаются использовать возможности более крупных моделей, «обучая» их собственным знаниям более мелкие модели, хотя они часто уступают оригиналу в производительности при решении сложных задач на рассуждение.

Другие способы сжатия моделей включают квантование, которое снижает точность параметров модели (границ, которые устанавливаются при ее обучении), и обрезку, которая удаляет отдельные веса или целые «нейроны».

«Сжимать большие модели ИИ без потери производительности очень сложно», — говорит Максвелл Венетос, инженер-исследователь в области ИИ в Citrine Informatics, компании-разработчике программного обеспечения, специализирующейся на материалах и химикатах, который не участвовал в проекте Multiverse. «Большинству методов приходится идти на компромисс между размером и производительностью. Интересно в подходе, вдохновлённом квантовой механикой, то, что он использует очень абстрактную математику для более точного, чем обычно, устранения избыточности».

Исследователи Multiverse утверждают, что такой подход позволяет выборочно устранять предвзятость или добавлять модели поведения в программы магистратуры права на детальном уровне. Помимо снятия цензуры со стороны китайских властей, исследователи могут добавлять или удалять другие виды предполагаемой предвзятости или специальных знаний. В будущем, по заявлению Multiverse, планируется сжать все основные модели с открытым исходным кодом.

Томас Као, доцент кафедры технологической политики Школы Флетчера при Университете Тафтса, говорит, что китайские власти требуют создания моделей для цензуры, и это требование теперь формирует глобальную информационную экосистему, учитывая, что многие из наиболее влиятельных моделей ИИ с открытым исходным кодом происходят из Китая.

Как ведущая китайская модель искусственного интеллекта преодолела санкции США. Читать далее

Учёные также начали документировать и анализировать это явление. Дженнифер Пан, профессор Стэнфордского университета, и профессор Принстона Сюй Сюй провели в начале этого года исследование, изучающее государственную цензуру в крупных языковых моделях. Они обнаружили, что модели, созданные в Китае, демонстрируют значительно более высокий уровень цензуры, особенно в ответ на подсказки на китайском языке.

Растёт интерес к попыткам устранить цензуру в китайских моделях. Ранее в этом году компания Perplexity, занимающаяся поиском в сфере искусственного интеллекта, выпустила собственную версию DeepSeek R1 без цензуры, назвав её R1 1776. Подход Perplexity включал пост-обучение модели на наборе данных из 40 000 многоязычных подсказок, связанных с цензурированными темами, — более традиционный метод тонкой настройки, чем тот, который использовала Multiverse.

Однако Цао предупреждает, что заявления о полной «ликвидации» цензуры могут быть преувеличением. Китайское правительство жёстко контролирует информацию в интернете с момента его появления, а это означает, что цензура — процесс динамичный и сложный. Она заложена в каждый уровень обучения ИИ, от сбора данных до финальных этапов настройки.

«Очень сложно воссоздать [модель без цензуры] всего лишь на основе ответов на такой небольшой набор вопросов», — говорит Цао.

Источник: www.technologyreview.com

✅ Найденные теги: Квантовые, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых