Архив рубрики ~Лента новостей~

Насколько полезна пятая глава мифологии Клода Фейбла для программирования?

Насколько полезна пятая глава мифологии Клода Фейбла для программирования?
Насколько полезна пятая глава мифологии Клода Фейбла для программирования?

Узнайте о плюсах и минусах пятой басни Клода.

Делиться

В этой статье я поделюсь своим мнением о Claude Fable 5, обсужу её достоинства и недостатки. Изображение предоставлено ChatGPT.

На прошлой неделе компания Anthropic выпустила свою последнюю модель, Claude Fable 5, которая представляла собой защищенную версию модели Claude Mythos.

Я тщательно тестировал эту модель днем и ночью с момента ее выпуска, в течение тех 72 часов, что она была доступна.

К сожалению, в настоящее время эта модель недоступна, поскольку ее выпуск был приостановлен по распоряжению правительства США. Однако, поскольку мне удалось подробно протестировать эту модель, я хотел бы поделиться своими впечатлениями о ней, о том, что мне удалось с ней сделать, о ее ограничениях и так далее. Несмотря на то, что модель сейчас недоступна, я верю и надеюсь, что она скоро снова появится в продаже. Я также думаю, что через несколько месяцев мы увидим другие модели с аналогичными возможностями.

Конечно, было много статей, посвященных Клоду Фабле и его возможностям. Я считаю эту статью интересной, потому что я каждый день работаю с Клодом Фабле, и делаю это практически ежедневно с начала 2026 года. Когда Клод Фабле был выпущен, я сразу же протестировал модель на полную мощность. У меня был ряд задач, которые Opus не мог выполнить с первого раза или легко, и я протестировал Клода Фабле на них, чтобы по-настоящему проверить его возможности.

Вам стоит ознакомиться с этой статьей, чтобы узнать мое мнение о возможностях Claude Fable, особенно в сравнении с другими моделями Frontier, такими как Claude Opus 4.8 и GPT-5.5.

Как максимально эффективно использовать басню Клода, часть 5
Эта инфографика освещает основное содержание статьи. Я расскажу о Claude Fable 5, сравню её с предыдущей моделью Anthropic — Opus 4.8, а также о том, что в Claude Fable хорошо, а что плохо. Изображение предоставлено ChatGPT.

Почему стоит интересоваться Клодом из «Басни 5»?

Прежде всего, давайте разберемся, почему вам стоит обратить внимание на Claude Fable 5. Это, пожалуй, самая ожидаемая игра в жанре LLM за всю историю, поскольку вокруг нее ходил ажиотаж за несколько месяцев до выхода.

Сама компания Anthropic потратила много времени на раскрутку этой модели, рассказывая о её возможностях и о том, насколько опасной она может оказаться в неумелых руках.

Поэтому многие с нетерпением ждали запуска этой модели, и наконец, на прошлой неделе она была запущена с полным доступом для всех, у кого есть подписка Claude Pro или Max.

Модель стала широко доступна для всех. Лично у меня не возникало никаких проблем с её использованием до субботнего утра по норвежскому времени. Хотя модель была доступна недолго (я думаю, около 72 часов), я считаю, что смог её основательно протестировать и составить хорошее мнение как о её преимуществах, так и о недостатках, а также об общих возможностях.

Что хорошо удается Клоду Фейблу

Прежде всего, я хочу рассказать о том, что хорошо получилось у Claude Fable. Моё общее впечатление таково, что он значительно лучше, чем Claude Opus 4.8. Я читал в интернете, что, по мнению других пользователей, его возможности не намного превосходят возможности Claude Opus 4.8. На мой взгляд, это явно не так. Я считаю, что люди, сообщающие об этом, не тестировали Claude Fable на достаточно сложных задачах.

Конечно, если вы попробуете Claude Fable на и без того простой задаче, с которой справляется Claude Opus, вы не оцените его в полной мере. Claude Fable по-настоящему раскрывает свой потенциал при решении сверхсложных задач программирования.

Выполнение сложных задач от начала до конца.

У меня было несколько задач, для решения которых я потратил некоторое время на работу с Claude Opus 4.8. Opus определенно справился с задачей, но это не была одноразовая реализация, и мне приходилось вручную направлять Claude Opus на протяжении некоторых этапов.

Эти задачи включали, например, следующее:

  • Реализация функции, для которой мне пришлось вносить изменения в код в нескольких репозиториях.
  • Исправление проблемы/ошибки, с которой столкнулся клиент, в связи с необходимостью улучшения возможностей извлечения информации из LLM-файла.

К сожалению, я не могу вдаваться в подробности по этим вопросам, поскольку это работа, которая ведется в закрытом коде. Чтобы сравнить Claude Opus и Claude Fable, я ранее применил Claude Opus к этим задачам и решил их с помощью довольно большого количества ручных указаний. Затем я применил его к Claude Fable, и он смог решить эти задачи с первого раза. Это явный признак того, что Fable — более мощная модель, чем Opus.

В качестве более общего замечания о возможностях Fable я бы сказал следующее:

Клод Фабл лучше справляется с выполнением задач от начала до конца, обладая как лучшим пониманием неоднозначностей и намерений пользователя, так и более эффективной реализацией запланированного решения, а также лучшей проверкой его корректности посредством навигации по интерфейсу компьютера или проведения интеграционных тестов.

Я просто обнаружил, что Клод Фабл способен работать дольше, выполняя более сложные задачи, не сдаваясь и не сталкиваясь с повторяющимися проблемами. Я просто почувствовал, что задачи теперь выполняются более автономно, и мне не нужно было давать много указаний, чтобы убедиться, что модель соответствует моим намерениям.

Выявление проблем в кодовых базах

Ещё одна невероятная особенность Claude Fable, которую я заметил, заключалась в том, что она гораздо лучше, чем Claude Opus, обнаруживала проблемы в коде, будь то ошибки, возможности для рефакторинга или потенциальные проблемы в будущем.

Я постоянно запускаю запрос, похожий на приведенный ниже, чтобы выявлять проблемы в своем коде.

 Scan thoroughly through the codebase to identify any potential bugs, issues, or refactoring opportunities, and come back to me with an HTML report with issues prioritized from most severe to least severe.

При запуске Claude Opus я получил тот же результат, но тоже не увидел хороших перспектив. Claude Opus не смог обнаружить никаких новых возможностей для рефакторинга или ошибок, либо обнаруженные проблемы оказались неактуальными. (Конечно, следует отметить, что это произошло после того, как я уже провел большую работу по рефакторингу и обнаружению ошибок с помощью Claude Opus в конкретном репозитории.)

Однако, когда я затем применил Claude Fable с тем же самым запросом, он начал обнаруживать множество серьезных проблем, как с точки зрения безопасности, так и реальных ошибок, а также множество возможностей для рефакторинга, которые Claude Opus не смог увидеть.

Я немедленно приступил к проверке всех репозиториев с помощью Клода Фабле, используя эту командную строку, и исправил все ошибки. Я отправил много кода, что значительно повысило качество моих кодовых баз.

Думаю, это, пожалуй, самый очевидный признак того, что Fable — более мощная модель, чем Opus. Можно запустить тот же самый запрос в том же самом коде, и Fable сможет обнаружить множество проблем, которые не удалось выявить с помощью Claude Opus.

Я просто рад, что успел провести рефакторинг, обнаружение ошибок и их исправление до того, как работа над моделью, к сожалению, была приостановлена.

Чего Клод Фейбл не умеет делать хорошо.

В предыдущем разделе я рассказал о том, что у Клода Фейбла действительно хорошо получается. Думаю, важно также отметить некоторые недостатки Клода Фейбла, учитывая, что это не идеальная модель.

Цена

Модель программирования Клода Фабле, безусловно, самая мощная из всех, что я когда-либо использовал. Однако одна из главных проблем заключается в том, сколько токенов она тратит на выполнение задач.

Естественно, проблема не в самой модели. Скорее, проблема в ограничениях скорости, которые установлены в Anthropic. Используя Claude Fable с подпиской, я стал достигать лимита подписки гораздо быстрее.

Это, безусловно, ограничение, поскольку модель больше нельзя запускать бесконечно. Более того, я бы сказал, что подписка на Claude Fable слишком дорога практически для всех компаний. Запуск модели, которая обходится в 10 долларов за миллион долларов на входе и 50 долларов за миллион долларов на выходе, нецелесообразен практически для всех, кроме крупнейших компаний.

Конечно, можно возразить, что модель Клода Фабле можно использовать только для планирования и только для обнаружения ошибок, а модель Клода Опуса — для практической реализации. Я согласен, что это, вероятно, возможно, и вы все равно получите большую часть преимуществ от модели Клода Фабле; однако тратить много времени на оптимизацию того, какую модель использовать в каких ситуациях, очень трудоемко, и этого определенно следует избегать, если вы хотите быть максимально продуктивным и эффективным.

Я бы сказал, что это один из главных недостатков: ограничения на количество запросов и стоимость использования модели при применении API-тарифов.

Иногда модель проявляет излишнее рвение.

Ещё один небольшой недостаток, который я хотел бы отметить в модели Клода Фабле, заключается в том, что она иногда слишком усердно ищет проблемы или выполняет изменения в коде. Иногда я обнаруживал, что модель реализует вещи чрезмерно сложным образом. Например, изменяет гораздо больше строк кода, чем это действительно необходимо, или находит больше проблем в кодовой базе, где многие из этих проблем на самом деле не так уж и серьёзны.

Иногда это меня немного раздражает, но я также считаю, что Anthropic пошла на компромисс. Конечно, вы хотите, чтобы модель постоянно искала проблемы и пыталась их исправить, и, конечно же, хотите, чтобы исправление работало немедленно. Трудно найти баланс между этой поспешностью и одновременно избежать чрезмерного стремления модели к поиску и исправлению проблем.

В целом, однако, это довольно незначительный недостаток. Это всего лишь одна мелочь, которую я заметил, используя Клода Фейбла. Самый большой недостаток — это непомерно высокая цена модели.

Заключение

В этой статье я поделился своими мыслями о модели Claude Fable. Я сравнил её с предыдущей моделью Frontier от Anthropic, которая называлась Claude Opus 4.8. Модель Claude Fable 5 невероятна, но у неё есть и некоторые недостатки:

  1. Один из недостатков – излишняя настойчивость, что, на мой взгляд, является довольно незначительным минусом.
  2. Цена. Цена, безусловно, является важным недостатком. Однако это не проблема самой модели, и лучшие модели всегда будут стоить дорого. Каждый может самостоятельно решить, стоит ли модель своих денег.

В целом, однако, это очень мощная модель. Я надеюсь, что она снова станет доступна, и что другие модели, как из других передовых лабораторий, так и модели с открытым исходным кодом, достигнут этих возможностей в течение нескольких месяцев, чтобы у нас появились еще более мощные агенты для кодирования, способные выполнять задачи разработки программного обеспечения.

Также ознакомьтесь с инструкцией «Как эффективно запускать множество агентов Claude Code параллельно».

👋 Свяжитесь с нами

👉 Моя бесплатная электронная книга и вебинар:

🚀 Десять раз повысьте свой инженерный уровень с помощью магистратуры (бесплатный 3-дневный курс по электронной почте)

📚 Получите мою бесплатную электронную книгу «Модели визуального языка».

💻 Мой вебинар по языковым моделям зрения

👉 Найдите меня в социальных сетях:

💌 Substack

🔗 LinkedIn

🐦 X / Twitter

Эйвинд Кьосбаккен Посмотреть все Эйвинд Кьосбаккен

Источник: towardsdatascience.com

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Полезное~ Список сервисов, которые отгружают пробные лимиты, имеют бесплатные тарифы, дают токены стартапам и студентам Новости робототехники Ultimate Robot Knockout Legend Новости робототехники Фреймворк для «красных» процессоров и модель «издатель — подписчик». Работаем с флотом ИИ-агентов на своей машине Архив рубрики ~Обо всем~ Теорема Фробениуса Архив рубрики ~Обо всем~ Два часа экранного времени в день ускорили восстановление после сотрясения мозга у подростков. Менее продолжительное время замедляло процесс Архив рубрики ~Обо всем~ Тим Кук из Apple заявил, что повышение цен «неизбежно». Архив рубрики ~Обо всем~ [Перевод] Туман живой! Учёные изучили, чем занимаются бактерии, живущие в каплях тумана Архив рубрики ~Обо всем~ 10 признаков того, что кто-то следит за вашими аккаунтами или получает к ним доступ — как это остановить. Новости робототехники Компания Waymo отзывает около 4000 роботакси, чтобы предотвратить их въезд в зоны проведения дорожных работ. Архив рубрики ~Обо всем~ Белки: мозаичный узор, управляющий ими всеми? Архив рубрики ~Обо всем~ Накопитель SanDisk Optimus GX PRO 850P на 8 Тбайт стоит в 4 раза дороже PS5, для которой он создан Архив рубрики ~Обо всем~ Физики получили новых «котов Шредингера» Архив рубрики ~Обо всем~ Использование ИИ правительством США стремительно растёт. И отсутствие прозрачности вызывает тревогу. | Натан Э. Сандерс и Брюс Шнайер Новости робототехники Airbus превратил вертолет H145 в транспортный беспилотник. Вместо кабины у него грузовой люк Архив рубрики ~Полезное~ Список сервисов, которые отгружают пробные лимиты, имеют бесплатные тарифы, дают токены стартапам и студентам Новости робототехники Ultimate Robot Knockout Legend Новости робототехники Фреймворк для «красных» процессоров и модель «издатель — подписчик». Работаем с флотом ИИ-агентов на своей машине Архив рубрики ~Обо всем~ Теорема Фробениуса Архив рубрики ~Обо всем~ Два часа экранного времени в день ускорили восстановление после сотрясения мозга у подростков. Менее продолжительное время замедляло процесс Архив рубрики ~Обо всем~ Тим Кук из Apple заявил, что повышение цен «неизбежно». Архив рубрики ~Обо всем~ [Перевод] Туман живой! Учёные изучили, чем занимаются бактерии, живущие в каплях тумана Архив рубрики ~Обо всем~ 10 признаков того, что кто-то следит за вашими аккаунтами или получает к ним доступ — как это остановить. Новости робототехники Компания Waymo отзывает около 4000 роботакси, чтобы предотвратить их въезд в зоны проведения дорожных работ. Архив рубрики ~Обо всем~ Белки: мозаичный узор, управляющий ими всеми? Архив рубрики ~Обо всем~ Накопитель SanDisk Optimus GX PRO 850P на 8 Тбайт стоит в 4 раза дороже PS5, для которой он создан Архив рубрики ~Обо всем~ Физики получили новых «котов Шредингера» Архив рубрики ~Обо всем~ Использование ИИ правительством США стремительно растёт. И отсутствие прозрачности вызывает тревогу. | Натан Э. Сандерс и Брюс Шнайер Новости робототехники Airbus превратил вертолет H145 в транспортный беспилотник. Вместо кабины у него грузовой люк

Оставить комментарий