Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге)

Буквально на днях Google выкатила gemini 3.5 flash. Маркетологи бьют в фанфары: легковесная модель обходит тяжелую gemini 3.1 pro на бенчмарках terminal bench 2.1 и MCP atlas! Но стоит открыть чат, и наступает разочарование. Модель общается сухим, бюрократическим, абсолютно безжизненным языком, уступая в человечности даже старой 3.0 flash. В этой статье мы разберем физику RLHF‑лоботомии, покажем, как оптимизация под агентов убивает энтропию генерации, и почему современные бенчмарки стали главным врагом развития ИИ.

Читать далее

Источник: habr.com

✅ Найденные теги: Flash, Gemini, Как Gemini, Красивых, новости, Ради, Сломали

Добавить комментарий

Новости других рубрик

Архив рубрики ~Лента новостей~: Динамические поверхностные коды открывают новые возможности для квантовой коррекции ошибок. Архив рубрики ~Лента новостей~: Необходим значительный прогресс в планировании исследований, учитывающих пол как биологическую переменную. Архив рубрики ~Лента новостей~: IPO компании SpaceX: хорошая попытка, но нет Архив рубрики ~Лента новостей~: Чип Vera от Nvidia — это ставка в 200 миллиардов долларов, которую Дженсен Хуанг не хочет, чтобы вы упустили из виду. Архив рубрики ~Лента новостей~: Музыкальный тест Тьюринга: проверка сознания ИИ с помощью музыки Архив рубрики ~Лента новостей~: Kore.ai запускает платформу для ИИ-агентов Artemis и бросает вызов Salesforce и ServiceNow. Архив рубрики ~Лента новостей~: Человеческие головы, сандалии и лягушки: стегоконтейнеры за тысячи лет до первого компьютера Архив рубрики ~Лента новостей~: Ученые сканировали ужасный кристалл, образовавшийся в результате ядерного взрыва, и обнаружили нечто странное