Image

📈 LLM улучшаются по экспоненте: к 2030 году они будут…

📈 LLM улучшаются по экспоненте: к 2030 году они будут с задачами, которые раньше требовали месяц работы сотрудника-человека

Исследовательская группа Model Evaluation & Threat Research из Калифорнийского университета в Беркли придумала новый способ измерять прогресс больших языковых моделей. Вместо привычных метрик вроде точности ответов или скорости генерации они предложили другой аспект: сколько времени требуется человеку на задачу, которую ИИ может успешно выполнить хотя бы в 50% случаев?

Согласно расчётам, с каждым годом модели справляются с всё более объёмными задачами, и темп этого роста — экспоненциальный. С 2019 года способности LLM в решении задач улучшаются вдвое каждые 7 месяцев:
▪️ GPT-2, вышедший в 2019 году, мог справиться только с ответами на вопросы, что в среднем занимает у человека до минуты;
▪️ а вот GPT-4, который появился в 2023, уже мог брать на себя задачу вроде «найти факт в интернете», которая занимает у человека от 8 до 15 минут;
▪️ более продвинутые модели вроде Claude 3.7 и OpenAI o1 могут бать на себя задачи, выполнение которых человеком выходит за пределы часа.

Если темпы роста сохранятся, то уже к 2030 году языковые модели смогут решать за часы задачи, которые потребовали бы 167 часов работы человека — это условный месяц работы в графике 5/2. Речь идёт о комплексной интеллектуальной работе: от оптимизации архитектуры кастомного чипа до запуска нового продукта или даже написания содержательной книги. В исследовании, например, в 167 часов оценена задача открыть новую компанию. Авторы исследования считают, что к 2030 году ИИ сможет браться за такую задачу автономно, т.е. не в виде ассистента, а как самостоятельный исполнитель.

Правда, исследование не учитывает внешние ограничивающие факторы, и авторы сами об этом говорят. Даже если ИИ будет таким умным, как его описывают, его возможности могут упереться в вычислительные мощности или доступ к памяти.

file 132

✅ Найденные теги: здоровье, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Иллюстрация анализа кожных заболеваний с помощью нейросети на экране смартфона.
Сравнение штрафов за досрочное снятие: график и пояснения.
Кадр из фильма с мужчиной в форме, текст: "Вы ведь включали сегодня [ценз], верно?"
Интерфейс браузера с текстом о Google Veo 3.1 и ссылками на источники.
Wi-Fi передатчик с антенной на фоне поля, радиус действия 1 км.
Скриншот интерфейса Windows с виджетами и обоями в синих тонах.
Интерфейс программы текст-в-речь, библиотека аудио и транскрипция на экране.
ideipro logotyp
Абстрактная иллюстрация с абстрактными фигурами и силуэтом человека в центре.
Image Not Found
Кадр из фильма с мужчиной в форме, текст: "Вы ведь включали сегодня [ценз], верно?"

⚡️ VPN в России может работать медленнее: популярные сервисы заявляют,…

⚡️ VPN в России может работать медленнее: популярные сервисы заявляют, что РКН перекрыл возможность «прямого» подключения к иностранным серверам. Если раньше банили конкретные IP‑адреса, то отныне нейросети отслеживают поведение трафика: они распознают протоколы и прицельно режут скорость.…

Мар 5, 2026
Wi-Fi передатчик с антенной на фоне поля, радиус действия 1 км.

Появился роутер способный раздавать интернет на расстояние до километра, а…

Появился роутер способный раздавать интернет на расстояние до километра, а также поддерживающий до 1000 подключённых устройств. Компания GL.iNet представила HaLowLink 2 — маршрутизатор, сделанный с упором не на скорость, а на дальность связи. Один такой роутер способен…

Мар 5, 2026
Скриншот интерфейса Windows с виджетами и обоями в синих тонах.

Windows 12 может выйти в этом году — инсайдеры PCWorld…

Windows 12 может выйти в этом году — инсайдеры PCWorld сообщают, что это произойдет сразу после окончания поддержки Windows 10 Ключевые особенности новинки: 🤩Модульная архитектура CorePC (система-конструктор) 🤩Глубокая кастомизация благодаря изолированным компонентам 🤩Внедрение ИИ-ассистента Copilot, который станет…

Мар 5, 2026
ideipro logotyp

OpenClaw теперь умеет в пространственное восприятие. Тестируют на роботе Unitree…

OpenClaw теперь умеет в пространственное восприятие. Тестируют на роботе Unitree G1, и выглядит реально круто. Как это работает: создает динамическую воксельную карту, которая отслеживает объекты и их изменения во времени. Короче, робот не просто видит комнату, а…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых