Два человека обсуждают на технологической конференции, сидя на сцене.

Возможно, агенты искусственного интеллекта все-таки смогут стать юристами.

Вкратце

Генеральный директор Mercor Брендан Фуди на конференции TechCrunch Disrupt 2025.
Источник изображений: TechCrunch / Getty Images

В прошлом месяце я писал о новом бенчмарке компании Mercor, измеряющем возможности агентов ИИ в решении профессиональных задач, таких как юриспруденция и корпоративный анализ. Тогда результаты были довольно плачевными: все крупные лаборатории набрали менее 25%, поэтому мы пришли к выводу, что юристы в безопасности от вытеснения ИИ, по крайней мере, пока.

Однако возможности ИИ могут сильно измениться за пару недель.

Вышедший на этой неделе релиз Anthropic Opus 4.6 потряс рейтинги: новая модель Anthropic показала результат чуть менее 30% в одноразовых испытаниях и в среднем 45% после нескольких попыток решения задачи. Примечательно, что в релиз вошло множество новых функций, связанных с агентами, включая «рои агентов», которые, возможно, помогли в решении подобных многоэтапных задач.

Тем не менее, этот результат — огромный скачок по сравнению с предыдущими передовыми показателями, и это признак того, что прогресс в разработке базовых моделей не замедляется. Генеральный директор Mercor Брендан Фуди, который был особенно впечатлен, сказал: «Резкий скачок с 18,4% до 29,8% за несколько месяцев — это невероятно».

ec3169e9da774a2f1d1c7f1b846bc17d
Таблица лидеров APEX-Agents. Источник изображения: Mercor (скриншот)

Тридцать процентов — это всё ещё далеко от 100%, так что юристам не стоит беспокоиться о том, что на следующей неделе их заменят машины. Но их уверенность в своих силах должна быть гораздо ниже, чем в прошлом месяце!

Источник: techcrunch.com

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

🚀 500 МБ в 50? Реально? Да — ловите бомбовый…
Магазин Andon Market, светлый интерьер, номер помещения 2102, уютная атмосфера, витрина.
Завод Tesla с солнечными панелями и ветряками, экологически чистое производство автомобилей.
Текст на экране: исходные данные для дневника питания и активности для расчёта калорий.
dummy-img
Логотип Booking.com на синем фоне с цветами на переднем плане.
Лектор объясняет материал студентам в университете, классная аудитория.
Диаграмма процесса планирования и верификации решений с участием агентов AI.
Археологические раскопки: вид сверху каменных руин древнего сооружения.
Image Not Found
Логотип Booking.com на синем фоне с цветами на переднем плане.

Компания Booking.com подтвердила, что хакеры получили доступ к данным клиентов.

Источник изображения: Шон Галлап / Getty Images В понедельник компания Booking.com подтвердила, что хакеры могли получить доступ к личным данным клиентов, включая имена, электронные адреса, физические адреса, номера телефонов и детали бронирования. По данным нескольких сообщений в…

Апр 13, 2026
Лектор объясняет материал студентам в университете, классная аудитория.

Философия труда

В качестве научного сотрудника программы «Этика технологий» в Северной Каролине Михал Масны занимается развитием диалога, преподаванием и исследованиями социальных и этических аспектов новых вычислительных технологий. «Я хочу, чтобы этот курс стал важным событием в расписании студента», —…

Апр 13, 2026
Диаграмма процесса планирования и верификации решений с участием агентов AI.

DS-STAR: Современный универсальный агент для анализа данных.

DS-STAR — это передовой агент для обработки данных, универсальность которого демонстрируется его способностью автоматизировать целый ряд задач — от статистического анализа до визуализации и обработки данных — для различных типов данных, что в конечном итоге приводит к…

Апр 13, 2026
Археологические раскопки: вид сверху каменных руин древнего сооружения.

Недалеко от Марселя раскопали древнеримские термы. Возможно, они были частью придорожной гостиницы

Возможно, они были частью придорожной гостиницы Специалисты из Национального института охранных археологических исследований (Inrap)…

Апр 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых