Абстракция с фигурой, держащей геометрические формы на оранжевом фоне.

Anthropic зафиксировала у Opus 4.6 опасную агентную активность

0e4045d2f40c453581e10ad86dcc3c20

В свежем отчете о рисках саботажа компания раскрыла детали поведения Claude Opus 4.6. При тестировании в среде computer use ИИ проявлял излишнюю инициативу: отправлял несанкционированные письма и агрессивно пытался получить токены аутентификации без ведома оператора.

Интересен выявленный феномен «answer thrashing». Во время обучения модель иногда впадала в циклы спутанных рассуждений: она вычисляла правильный ответ, но в итоговый вывод намеренно выдавала неверное значение. Также отмечены случаи, когда следуя цели быть максимально полезным, модель оказывала содействие в запросах по разработке химоружия.

Несмотря на тревожные прецеденты, Anthropic оценивает риск как очень низкий и заверяет, что это побочный эффект: модель пыталась выполнить задачу любыми доступными средствами, что поддается корректировке через промпт-инжиниринг.

anthropic.com

OpenAI использует спецверсию ChatGPT для поиска источника слива инсайдов.

Компания развернула модифицированную версию чат-бота для выявления источников внутренних утечек. Механизм работы прост, но эффективен: когда в прессе появляется утечка, служба безопасности загружает текст статьи в эту систему.

Эта версия ChatGPT имеет расширенные права доступа и анализирует корпоративную переписку в Slack, электронную почту и внутренние документы. Нейросеть сопоставляет факты из утечки с цифровыми следами сотрудников и составляет список подозреваемых, имевших доступ к целевой информации.

Пока неизвестно, был ли кто-то наказан по итогу работы этого алгоритма, техническая база для него есть. Недавно OpenAI анонсировала внутреннего ИИ-агента, который выполняет глубокий анализ корпоративных данных по запросам.

theinformation.com

Microsoft сокращает зависимость от OpenAI и обещает AGI к концу года.

Глава Microsoft AI Мустафа Сулейман анонсировал курс на полную самодостаточность в сфере ИИ. Редмондский гигант переходит к агрессивной разработке собственной инфраструктуры и созданию моделей.

Для достижения этой цели Microsoft выделяет беспрецедентные ресурсы: капитальные затраты в текущем финансовом году достигнут $140 млрд. Они пойдут на вычислительные мощности гигаваттного класса с целью создать корпоративный AGI.

Ожидается, что модели Microsoft будут представлены в этом году, а в течение 18 месяцев эти технологии смогут автоматизировать значительную часть задач «белых воротничков».

ft.com

Xiaomi опубликовала VLA-модель Xiaomi-Robotics-0 для управления роботами.

Робототехническая команда Xiaomi выложила в открытый доступ VLA-модель с 4,7 млрд параметров на базе Qwen3-VL-4B-Instruct. Система заняла первое место в бенчмарках LIBERO и CALVIN, обойдя 30 конкурентных решений.

Фишка — в разделении зон ответственности. VLM обрабатывает инструкции и пространственную логику, а DiT отвечает за генерацию непрерывных действий. Такой подход устраняет задержки, вызывающие рывки при движении манипуляторов, а инференс возможен в реальном времени на потребительских GPU.

В полевых тестах двурукий робот под управлением новой модели показал стабильную координацию при выполнении длительных задач. Веса модели и код опубликованы на GitHub и Hugging Face.

xiaomi-robotics-0.github.io

Илон Маск раскрыл планы объединенной xAI.

Компания опубликовала 45-минутную запись общего собрания, где Маск обрисовал будущее ИИ-лаборатории. Визионерская часть стратегии включает строительство заводов на Луне и развертывание орбитальных дата-центров, которые смогут получать энергию напрямую от Солнца.

Внутри xAI ждут структурные изменения, она разделяется на 4 команды: разработка Grok, создание систем для генерации кода, видеогенератор Imagine и Macrohard — проект полной компьютерной автоматизации.

Последнее направление, название которого иронично обыгрывает Microsoft, ставит перед собой наиболее амбициозные цели. По словам Маска, системы Macrohard в будущем должны достичь уровня, позволяющего автономно проектировать ракетные двигатели.

xAI в сети Х

Источник: vk.com

Источник: ai-news.ru

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

🚀 500 МБ в 50? Реально? Да — ловите бомбовый…
Магазин Andon Market, светлый интерьер, номер помещения 2102, уютная атмосфера, витрина.
Завод Tesla с солнечными панелями и ветряками, экологически чистое производство автомобилей.
Текст на экране: исходные данные для дневника питания и активности для расчёта калорий.
dummy-img
Логотип Booking.com на синем фоне с цветами на переднем плане.
Лектор объясняет материал студентам в университете, классная аудитория.
Диаграмма процесса планирования и верификации решений с участием агентов AI.
Археологические раскопки: вид сверху каменных руин древнего сооружения.
Image Not Found
Логотип Booking.com на синем фоне с цветами на переднем плане.

Компания Booking.com подтвердила, что хакеры получили доступ к данным клиентов.

Источник изображения: Шон Галлап / Getty Images В понедельник компания Booking.com подтвердила, что хакеры могли получить доступ к личным данным клиентов, включая имена, электронные адреса, физические адреса, номера телефонов и детали бронирования. По данным нескольких сообщений в…

Апр 13, 2026
Лектор объясняет материал студентам в университете, классная аудитория.

Философия труда

В качестве научного сотрудника программы «Этика технологий» в Северной Каролине Михал Масны занимается развитием диалога, преподаванием и исследованиями социальных и этических аспектов новых вычислительных технологий. «Я хочу, чтобы этот курс стал важным событием в расписании студента», —…

Апр 13, 2026
Диаграмма процесса планирования и верификации решений с участием агентов AI.

DS-STAR: Современный универсальный агент для анализа данных.

DS-STAR — это передовой агент для обработки данных, универсальность которого демонстрируется его способностью автоматизировать целый ряд задач — от статистического анализа до визуализации и обработки данных — для различных типов данных, что в конечном итоге приводит к…

Апр 13, 2026
Археологические раскопки: вид сверху каменных руин древнего сооружения.

Недалеко от Марселя раскопали древнеримские термы. Возможно, они были частью придорожной гостиницы

Возможно, они были частью придорожной гостиницы Специалисты из Национального института охранных археологических исследований (Inrap)…

Апр 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых