Архив рубрики ~Коротко из Telegram~

💯 Исследователи проверили, способны ли современные AI-агенты самостоятельно изучать незнакомую…

💯 Исследователи проверили, способны ли современные AI-агенты самостоятельно изучать незнакомую…
File 2620

💯 Исследователи проверили, способны ли современные AI-агенты самостоятельно изучать незнакомую среду и выявлять её скрытые правила через взаимодействие. Для этого моделям предложили раскрыть структуру скрытого конечного автомата, задавая вопросы и выдвигая гипотезы.

Результаты показали, что LLM действительно умеют находить закономерности, но с ростом сложности быстро начинают ошибаться. Лучше всего справляются reasoning-модели, однако даже они заметно уступают классическим алгоритмам по эффективности и надёжности.

🪟 Получается, что современные AI-агенты уже умеют исследовать новые системы, но до полноценного понимания мира им пока ещё далеко.

Как думаете, что появится раньше: AI, который действительно понимает окружающий мир, или AI, который просто научится ещё лучше имитировать понимание?

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Новости робототехники Резервуар «Содержание» для масштабирования агротехнических стартапов Архив рубрики ~Лента новостей~ Сможет ли робот Пеппер стать хорошим товарищем по играм? Новости робототехники УЦН — это вам не уценка А прямой путь к… Архив рубрики ~Лента новостей~ ИИ в химии: история участия в хакатоне и рефлексия после Архив рубрики ~Лента новостей~ Супердорогая новая команда искусственного интеллекта Меты уже стала полной катастрофой Архив рубрики ~Лента новостей~ Модель Alibaba никогда не обучалась как агент, но улучшила показатели работы агентов по семи критериям. Архив рубрики ~Лента новостей~ Anthropic выпустила Claude Tag — ИИ-агента для совместной работы в сторонних приложениях Архив рубрики ~Лента новостей~ iPhone Ultra или iPhone Fold? Вот всё, что говорят утечки о складном смартфоне Apple 2026 года. Новости робототехники Система гидролокатора и камеры позволяет видеть сквозь мутную воду. Архив рубрики ~Лента новостей~ Собрал ИИ-бенчмарк под себя из 2 месяцев своих сессий — и дорогие модели проиграли дешёвым Архив рубрики ~Лента новостей~ Технология HarnessX от Xiaomi переписывает собственную структуру искусственного интеллекта прямо во время выполнения задачи — и это особенно выгодно для моделей меньшего размера. Архив рубрики ~Лента новостей~ Anthropic вместе с Frontend Masters выкатили бесплатный курс по Claude Code. Архив рубрики ~Лента новостей~ Зачем GenAI-ассистенту platform logic: как управлять источниками, evidence и ответами Архив рубрики ~Лента новостей~ Midjourney погрузила человека в воду для ультразвуковой компьютерной томографии всего тела. Сканер планируется продвигать как спа-салон Новости робототехники Резервуар «Содержание» для масштабирования агротехнических стартапов Архив рубрики ~Лента новостей~ Сможет ли робот Пеппер стать хорошим товарищем по играм? Новости робототехники УЦН — это вам не уценка А прямой путь к… Архив рубрики ~Лента новостей~ ИИ в химии: история участия в хакатоне и рефлексия после Архив рубрики ~Лента новостей~ Супердорогая новая команда искусственного интеллекта Меты уже стала полной катастрофой Архив рубрики ~Лента новостей~ Модель Alibaba никогда не обучалась как агент, но улучшила показатели работы агентов по семи критериям. Архив рубрики ~Лента новостей~ Anthropic выпустила Claude Tag — ИИ-агента для совместной работы в сторонних приложениях Архив рубрики ~Лента новостей~ iPhone Ultra или iPhone Fold? Вот всё, что говорят утечки о складном смартфоне Apple 2026 года. Новости робототехники Система гидролокатора и камеры позволяет видеть сквозь мутную воду. Архив рубрики ~Лента новостей~ Собрал ИИ-бенчмарк под себя из 2 месяцев своих сессий — и дорогие модели проиграли дешёвым Архив рубрики ~Лента новостей~ Технология HarnessX от Xiaomi переписывает собственную структуру искусственного интеллекта прямо во время выполнения задачи — и это особенно выгодно для моделей меньшего размера. Архив рубрики ~Лента новостей~ Anthropic вместе с Frontend Masters выкатили бесплатный курс по Claude Code. Архив рубрики ~Лента новостей~ Зачем GenAI-ассистенту platform logic: как управлять источниками, evidence и ответами Архив рубрики ~Лента новостей~ Midjourney погрузила человека в воду для ультразвуковой компьютерной томографии всего тела. Сканер планируется продвигать как спа-салон

Оставить комментарий