Абстрактный узор на черном фоне с текстом "Gemma 4" в центре.

Google объявляет об открытии 4 моделей искусственного интеллекта под управлением Gemma и переходе на лицензию Apache 2.0.

Gemma 4 представляет собой первое крупное обновление открытых моделей Google за год.

Логотип героя Джеммы 4 Источник: Google Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию

За последний год модели искусственного интеллекта Gemini от Google значительно улучшились, но использовать Gemini можно только на условиях Google. Модели Gemma с открытыми весами предоставили больше свободы, но Gemma 3, запущенная более года назад, уже немного устарела. Начиная с сегодняшнего дня, разработчики могут начать работать с Gemma 4, которая доступна в четырех размерах, оптимизированных для локального использования. Google также признала недовольство разработчиков лицензированием ИИ, поэтому отказывается от пользовательской лицензии Gemma.

Как и в предыдущих версиях своих моделей с открытыми весами, Google разработала Gemma 4 таким образом, чтобы её можно было использовать на локальных машинах. Это, конечно, может означать многое. Два больших варианта Gemma, 26B Mixture of Experts и 31B Dense, предназначены для работы без квантования в формате bfloat16 на одном 80-гигабайтном графическом процессоре Nvidia H100. Конечно, это ускоритель ИИ стоимостью 20 000 долларов, но это всё ещё локальное оборудование. Если квантовать для работы с более низкой точностью, эти большие модели поместятся на потребительских графических процессорах.

Google также утверждает, что сосредоточилась на снижении задержки, чтобы в полной мере использовать преимущества локальной обработки Gemma. Модель 26B Mixture of Experts активирует в режиме вывода только 3,8 миллиарда из своих 26 миллиардов параметров, что обеспечивает ей гораздо более высокую производительность (токенов в секунду), чем у моделей аналогичного размера. Между тем, модель 31B Dense больше ориентирована на качество, чем на скорость, но Google ожидает, что разработчики будут дорабатывать её для конкретных задач.

Что нового в 4-й серии «Джеммы»?

Две другие модели Gemma 4, Effective 2B (E2B) и Effective 4B (E4B), предназначены для мобильных устройств. Эти варианты разработаны для поддержания низкого уровня использования памяти во время выполнения инференции, работая с эффективным количеством параметров в 2 миллиарда или 4 миллиарда. Google заявляет, что команда Pixel тесно сотрудничала с Qualcomm и MediaTek для оптимизации этих моделей для таких устройств, как смартфоны, Raspberry Pi и Jetson Nano. Они не только потребляют меньше памяти и заряда батареи, чем Gemma 3, но Google также заявляет о «практически нулевой задержке» в этот раз.

Более мощный, более открытый

По сообщениям, все новые модели Gemma 4 значительно превзойдут Gemma 3 — Google утверждает, что это самые производительные модели, которые можно запустить на локальном оборудовании. Google заявляет, что Gemma 31B дебютирует на третьем месте в списке лучших открытых моделей ИИ Arena, после GLM-5 и Kimi 2.5. Однако даже самый большой вариант Gemma 4 значительно меньше этих моделей, что теоретически делает его гораздо дешевле в эксплуатации.

Основанная на той же базовой технологии, что и закрытые модели Google Gemini 3, Gemma 4 предлагает улучшенные возможности рассуждения, математические вычисления и следование инструкциям. За последний год ИИ также сместился в сторону управления рабочими процессами с помощью агентов, и Gemma 4 готова к этим изменениям, поддерживая вызов собственных функций, структурированный вывод JSON и собственные инструкции для распространенных инструментов и API.

Генерация кода также становится ключевым применением генеративного ИИ, и Google утверждает, что Gemma 4 оптимизирована и для этого. Генерировать качественный код можно с помощью множества систем ИИ, но такие высокоэффективные решения, как Gemini Pro и Claude Code, представляют собой облачные сервисы.

Google утверждает, что Gemma 4 может обеспечить аналогично высокое качество кода в автономном режиме, при условии наличия оборудования для запуска более крупных версий. Аналогично, Google заявляет, что Gemma 4 лучше обрабатывает визуальный ввод, что делает такие задачи, как распознавание текста и распознавание диаграмм, более надежными на локальных системах. Эффективные модели E2B и E4B также имеют встроенную поддержку распознавания речи — семейство Gemma 3 также обладало этой функцией, но Google, похоже, подразумевает, что Gemma 4 в этом отношении лучше.

График результатов Arena ELO Модель Gemma 4 демонстрирует высокий рейтинг Arena ELO при значительно меньшем количестве параметров, чем ведущие модели. Источник: Google
Модель Gemma 4 демонстрирует высокий рейтинг Arena ELO при значительно меньшем количестве параметров, чем ведущие модели. Источник: Google

Всё это работает более чем на 140 языках, и независимо от того, какой язык вы используете, Gemma 4 может обрабатывать огромное количество слов. Окно контекста для моделей на периферии теперь составляет 128 тысяч токенов, а для моделей 26B и 31B — 256 тысяч. Этого достаточно для локальной модели, но облачные модели Gemini гораздо щедрее, предоставляя 1 миллион токенов контекста.

Все заявленные улучшения производительности — это хорошо, но, возможно, наиболее важным изменением для Gemma является изменение в лицензировании. Предыдущие версии открытых моделей Google поставлялись с собственной лицензией Google, которую многие разработчики считали слишком ограничительной. Лицензия Gemma 3 содержала строгую политику запрещенного использования, которую Google могла обновлять в одностороннем порядке, и требовала от разработчиков соблюдения правил Google во всех проектах, основанных на Gemma. Ее даже можно было интерпретировать как перенос лицензии на другие модели ИИ, созданные с использованием синтетических данных, полученных с помощью Gemma. Это вызывало у многих разработчиков опасения по поводу использования открытых моделей Google.

В сравнении с этим, Apache 2.0 гораздо более либерален, без навязчивых условий использования или коммерческих ограничений. Разработчики знакомы с Apache и чувствуют себя с ним комфортно, и Google не может просто так решить, что лицензия будет работать по-другому в будущем. Google считает, что предоставление разработчикам большего контроля над своими данными и планами развертывания таким образом побудит их использовать Gemma для большего количества проектов и расширить то, что компания настаивает называть «Gemmaverse».

Скоро появится новая нано-модель.

Выпуск E2B и E4B также демонстрирует, в каком направлении Google движется в своих усилиях по развитию искусственного интеллекта в смартфонах. В телефонах Google Pixel и некоторых других моделях используется локальный ИИ, известный как Gemini Nano. Именно благодаря ему эти телефоны Android могут обнаруживать телефонные и текстовые мошенничества, составлять краткие заметки или создавать сводки телефонных звонков, не отправляя ваши данные в облако. Представитель Google отмечает, что Gemini Nano всегда создавался на основе моделей Gemma, но это особенно верно для обновления следующего поколения до Gemini Nano 4.

Это первый случай, когда Google подтвердила выпуск обновленной версии своей минимальной модели искусственного интеллекта для смартфонов. Текущая модель Gemini Nano 3, работающая на телефонах Pixel, основана на Gemma 3n, но Google подтвердила Ars Technica, что следующее поколение Nano 4 будет иметь варианты 2B и 4B на базе Gemma 4 E2B и E4B.

Компания приглашает разработчиков начать прототипирование рабочих процессов агентов в последней предварительной версии AI Core Developer Preview с моделями Gemma E2B и E4B. Системы, разработанные с использованием этих новых моделей, будут обратно совместимы с Gemini Nano 4 после его запуска. Возможно, мы узнаем об этом подробнее на конференции I/O через несколько недель.

Новые модели Gemma можно сразу же протестировать в AI Studio (31B и 26B MoE) и AI Edge Gallery (E4B и E2B). Весовые коэффициенты моделей также можно загрузить полностью с Hugging Face, Kaggle и Ollama. Хотя модели оптимизированы для локальной обработки, Google также с удовольствием запустит их для вас в Google Cloud за определенную плату.

Источник: arstechnica.com

✅ Найденные теги: Apache 2.0, Gemma, Google, искусственный интеллект, Лицензия, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Астронавт на Луне с камерой, отражение Земли в шлеме. Космос, исследование.
Астронавт на поверхности Луны, отражение в шлеме, лунная миссия, космическая съемка.
Современный черный игровой компьютерный стол с крючками для наушников и стакана.
Три миски с горохом на столе, узорчатая тарелка и перцы на заднем плане.
Человек в футболке с микрофоном и трофеем на сцене.
Карьера с гранитными обломками и каменными стенами, вид сверху.
Вид Земли из-за горизонта Луны, космическое фото, Земля и Луна в космосе.
Группа людей в лаборатории, одетых в серые халаты, рядом с лабораторным оборудованием.
Футуристический солдат в броне с оружием на экране в высокотехнологичном помещении.
Image Not Found
Современный черный игровой компьютерный стол с крючками для наушников и стакана.

Стальная рама + стеклянная столешница + беспроводная зарядка = электрический стол ZONE 51 e-Artorias

Самое время взглянуть на то, что происходит в сегменте компьютерных столов, где компания ZONE 51 выпустила новинку в виде e-Artorias — электрического стола, предлагающего довольно приятные возможности. Как и положено современным решениям, каркас новинки изготавливается из стали…

Апр 8, 2026
Группа людей в лаборатории, одетых в серые халаты, рядом с лабораторным оборудованием.

Соединение никеля поможет эффективно превратить тяжелую нефть в легкую

Коллектив исследователей © Михаил Варфоломеев / КФУ Ученые нашли способ сделать переработку тяжелой нефти прямо в пласте более эффективной. Эксперимент с применением модельных молекул показал, что можно удалить до 97% серосодержащих соединений и повысить качество сырья с…

Апр 8, 2026
Футуристический солдат в броне с оружием на экране в высокотехнологичном помещении.

Бюджетный монитор Skyworth с функциями для игр и работы

Компания Skyworth вывела на китайский рынок доступный игровой монитор Skyworth G27 SE, который делает ставку на баланс цены и характеристик.  Устройство получило 27-дюймовую IPS-матрицу с разрешением Full HD и частотой обновления 144 Гц, что обеспечивает плавное отображение…

Апр 8, 2026
Автомобиль Skoda с камуфляжем на фоне горного озера и снежных вершин.

Новый флагман Škoda: 7-местный электромобиль Peaq

Электрический внедорожник Škoda Peaq уже называют самым крупным и технологичным автомобилем марки. Предсерийный образец недавно показали на озере озеро Комо, где он прошёл первые тесты, продемонстрировав управляемость, характерную для бренда. По габаритам новинка превосходит даже крупный Kodiaq,…

Апр 8, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых