Абстракция с фигурой, держащей геометрические формы на оранжевом фоне.

Anthropic зафиксировала у Opus 4.6 опасную агентную активность

0e4045d2f40c453581e10ad86dcc3c20

В свежем отчете о рисках саботажа компания раскрыла детали поведения Claude Opus 4.6. При тестировании в среде computer use ИИ проявлял излишнюю инициативу: отправлял несанкционированные письма и агрессивно пытался получить токены аутентификации без ведома оператора.

Интересен выявленный феномен «answer thrashing». Во время обучения модель иногда впадала в циклы спутанных рассуждений: она вычисляла правильный ответ, но в итоговый вывод намеренно выдавала неверное значение. Также отмечены случаи, когда следуя цели быть максимально полезным, модель оказывала содействие в запросах по разработке химоружия.

Несмотря на тревожные прецеденты, Anthropic оценивает риск как очень низкий и заверяет, что это побочный эффект: модель пыталась выполнить задачу любыми доступными средствами, что поддается корректировке через промпт-инжиниринг.

anthropic.com

OpenAI использует спецверсию ChatGPT для поиска источника слива инсайдов.

Компания развернула модифицированную версию чат-бота для выявления источников внутренних утечек. Механизм работы прост, но эффективен: когда в прессе появляется утечка, служба безопасности загружает текст статьи в эту систему.

Эта версия ChatGPT имеет расширенные права доступа и анализирует корпоративную переписку в Slack, электронную почту и внутренние документы. Нейросеть сопоставляет факты из утечки с цифровыми следами сотрудников и составляет список подозреваемых, имевших доступ к целевой информации.

Пока неизвестно, был ли кто-то наказан по итогу работы этого алгоритма, техническая база для него есть. Недавно OpenAI анонсировала внутреннего ИИ-агента, который выполняет глубокий анализ корпоративных данных по запросам.

theinformation.com

Microsoft сокращает зависимость от OpenAI и обещает AGI к концу года.

Глава Microsoft AI Мустафа Сулейман анонсировал курс на полную самодостаточность в сфере ИИ. Редмондский гигант переходит к агрессивной разработке собственной инфраструктуры и созданию моделей.

Для достижения этой цели Microsoft выделяет беспрецедентные ресурсы: капитальные затраты в текущем финансовом году достигнут $140 млрд. Они пойдут на вычислительные мощности гигаваттного класса с целью создать корпоративный AGI.

Ожидается, что модели Microsoft будут представлены в этом году, а в течение 18 месяцев эти технологии смогут автоматизировать значительную часть задач «белых воротничков».

ft.com

Xiaomi опубликовала VLA-модель Xiaomi-Robotics-0 для управления роботами.

Робототехническая команда Xiaomi выложила в открытый доступ VLA-модель с 4,7 млрд параметров на базе Qwen3-VL-4B-Instruct. Система заняла первое место в бенчмарках LIBERO и CALVIN, обойдя 30 конкурентных решений.

Фишка — в разделении зон ответственности. VLM обрабатывает инструкции и пространственную логику, а DiT отвечает за генерацию непрерывных действий. Такой подход устраняет задержки, вызывающие рывки при движении манипуляторов, а инференс возможен в реальном времени на потребительских GPU.

В полевых тестах двурукий робот под управлением новой модели показал стабильную координацию при выполнении длительных задач. Веса модели и код опубликованы на GitHub и Hugging Face.

xiaomi-robotics-0.github.io

Илон Маск раскрыл планы объединенной xAI.

Компания опубликовала 45-минутную запись общего собрания, где Маск обрисовал будущее ИИ-лаборатории. Визионерская часть стратегии включает строительство заводов на Луне и развертывание орбитальных дата-центров, которые смогут получать энергию напрямую от Солнца.

Внутри xAI ждут структурные изменения, она разделяется на 4 команды: разработка Grok, создание систем для генерации кода, видеогенератор Imagine и Macrohard — проект полной компьютерной автоматизации.

Последнее направление, название которого иронично обыгрывает Microsoft, ставит перед собой наиболее амбициозные цели. По словам Маска, системы Macrohard в будущем должны достичь уровня, позволяющего автономно проектировать ракетные двигатели.

xAI в сети Х

Источник: vk.com

Источник: ai-news.ru

✅ Найденные теги: Anthropic, Opus, Агентная Активность, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ideipro logotyp
В рамках семинара используются медицинские ситуации, возникающие у астронавтов, для переосмысления системы здравоохранения, ориентированной на ценность оказываемой помощи | MobiHealthNews
STAT+: Спустя месяц программа TrumpRx не оправдала грандиозных обещаний президента.
Человек с зонтом на фоне логотипа AT&T на синем фоне.
Абстрактный логотип Apple на черном фоне, человек стоит внизу.
ideipro logotyp
Прагматичный подход: разработка ИИ для реального мира.
ideipro logotyp
Рука с декоративными элементами и яркими объектами на фоне синего цвета.
Image Not Found
ideipro logotyp

Сана наблюдает 14-месячную выработку инсулина после трансплантации островковых клеток у одного пациента с диабетом 1 типа.

В ходе 14-месячного наблюдения компания Sana Biotechnology обнаружила, что ее экспериментальная аллогенная клеточная терапия продолжала вырабатывать инсулин у одного пациента с диабетом 1 типа, при этом никаких проблем с безопасностью не было выявлено. Биотехнологическая компания из Сиэтла…

Мар 17, 2026
В рамках семинара используются медицинские ситуации, возникающие у астронавтов, для переосмысления системы здравоохранения, ориентированной на ценность оказываемой помощи | MobiHealthNews

В рамках семинара используются медицинские ситуации, возникающие у астронавтов, для переосмысления системы здравоохранения, ориентированной на ценность оказываемой помощи | MobiHealthNews

В ходе HIMSS26 участники использовали симуляции оказания медицинской помощи астронавтам в чрезвычайных ситуациях для изучения принятия решений, распределения ресурсов и стратегий оказания медицинской помощи, ориентированных на ценность, в условиях экстремальных ограничений. Медицинская помощь, ориентированная на ценность. Фото:…

Мар 17, 2026
STAT+: Спустя месяц программа TrumpRx не оправдала грандиозных обещаний президента.

STAT+: Спустя месяц программа TrumpRx не оправдала грандиозных обещаний президента.

Небольшое количество лекарств и неравномерная экономия — вот что характеризует первые дни работы сайта Трампа, предлагающего лекарства по сниженным ценам. Управление оповещениями для этой статьи Отправить эту статью по электронной почте Поделитесь этой статьей Президент Трамп представляет…

Мар 17, 2026
Человек с зонтом на фоне логотипа AT&T на синем фоне.

Ещё один пользователь AT&T FirstNet получил шокирующий счёт на 6200 долларов, по цене 2 доллара за мегабайт.

Необычный списание средств со счета FirstNet, практически идентичный тому, которое было произведено другому пользователю в 2024 году. Источник: Getty Images | Рональд Мартинес Источник: Getty Images | Рональд Мартинес Настройки текста Текст рассказа Размер Маленький Стандартный Большой…

Мар 17, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых