
Лидером остается Gemini 3.0 Pro с 45.6%.
Что такое Cortex-AGI?
— Это бенчмарк на абстрактное рассуждение и логику.
— Задачи процедурно генерируются, разбиты на 10 уровней сложности.
— Нельзя опереться на запоминание данных, модель должна реально рассуждать.
— Платформа сравнивает проприетарные модели и open source решения в одном строгом тесте.
Open source уже приближается к закрытым решениям по способности к логическому выводу. DeepSeek сокращает разрыв, а Gemini удерживает лидерство.
Источник: vk.com
Источник: ai-news.ru























