Абстрактный узор на черном фоне с текстом "Gemma 4" в центре.

Google объявляет об открытии 4 моделей искусственного интеллекта под управлением Gemma и переходе на лицензию Apache 2.0.

Gemma 4 представляет собой первое крупное обновление открытых моделей Google за год.

Логотип героя Джеммы 4 Источник: Google Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию

За последний год модели искусственного интеллекта Gemini от Google значительно улучшились, но использовать Gemini можно только на условиях Google. Модели Gemma с открытыми весами предоставили больше свободы, но Gemma 3, запущенная более года назад, уже немного устарела. Начиная с сегодняшнего дня, разработчики могут начать работать с Gemma 4, которая доступна в четырех размерах, оптимизированных для локального использования. Google также признала недовольство разработчиков лицензированием ИИ, поэтому отказывается от пользовательской лицензии Gemma.

Как и в предыдущих версиях своих моделей с открытыми весами, Google разработала Gemma 4 таким образом, чтобы её можно было использовать на локальных машинах. Это, конечно, может означать многое. Два больших варианта Gemma, 26B Mixture of Experts и 31B Dense, предназначены для работы без квантования в формате bfloat16 на одном 80-гигабайтном графическом процессоре Nvidia H100. Конечно, это ускоритель ИИ стоимостью 20 000 долларов, но это всё ещё локальное оборудование. Если квантовать для работы с более низкой точностью, эти большие модели поместятся на потребительских графических процессорах.

Google также утверждает, что сосредоточилась на снижении задержки, чтобы в полной мере использовать преимущества локальной обработки Gemma. Модель 26B Mixture of Experts активирует в режиме вывода только 3,8 миллиарда из своих 26 миллиардов параметров, что обеспечивает ей гораздо более высокую производительность (токенов в секунду), чем у моделей аналогичного размера. Между тем, модель 31B Dense больше ориентирована на качество, чем на скорость, но Google ожидает, что разработчики будут дорабатывать её для конкретных задач.

Что нового в 4-й серии «Джеммы»?

Две другие модели Gemma 4, Effective 2B (E2B) и Effective 4B (E4B), предназначены для мобильных устройств. Эти варианты разработаны для поддержания низкого уровня использования памяти во время выполнения инференции, работая с эффективным количеством параметров в 2 миллиарда или 4 миллиарда. Google заявляет, что команда Pixel тесно сотрудничала с Qualcomm и MediaTek для оптимизации этих моделей для таких устройств, как смартфоны, Raspberry Pi и Jetson Nano. Они не только потребляют меньше памяти и заряда батареи, чем Gemma 3, но Google также заявляет о «практически нулевой задержке» в этот раз.

Более мощный, более открытый

По сообщениям, все новые модели Gemma 4 значительно превзойдут Gemma 3 — Google утверждает, что это самые производительные модели, которые можно запустить на локальном оборудовании. Google заявляет, что Gemma 31B дебютирует на третьем месте в списке лучших открытых моделей ИИ Arena, после GLM-5 и Kimi 2.5. Однако даже самый большой вариант Gemma 4 значительно меньше этих моделей, что теоретически делает его гораздо дешевле в эксплуатации.

Основанная на той же базовой технологии, что и закрытые модели Google Gemini 3, Gemma 4 предлагает улучшенные возможности рассуждения, математические вычисления и следование инструкциям. За последний год ИИ также сместился в сторону управления рабочими процессами с помощью агентов, и Gemma 4 готова к этим изменениям, поддерживая вызов собственных функций, структурированный вывод JSON и собственные инструкции для распространенных инструментов и API.

Генерация кода также становится ключевым применением генеративного ИИ, и Google утверждает, что Gemma 4 оптимизирована и для этого. Генерировать качественный код можно с помощью множества систем ИИ, но такие высокоэффективные решения, как Gemini Pro и Claude Code, представляют собой облачные сервисы.

Google утверждает, что Gemma 4 может обеспечить аналогично высокое качество кода в автономном режиме, при условии наличия оборудования для запуска более крупных версий. Аналогично, Google заявляет, что Gemma 4 лучше обрабатывает визуальный ввод, что делает такие задачи, как распознавание текста и распознавание диаграмм, более надежными на локальных системах. Эффективные модели E2B и E4B также имеют встроенную поддержку распознавания речи — семейство Gemma 3 также обладало этой функцией, но Google, похоже, подразумевает, что Gemma 4 в этом отношении лучше.

График результатов Arena ELO Модель Gemma 4 демонстрирует высокий рейтинг Arena ELO при значительно меньшем количестве параметров, чем ведущие модели. Источник: Google
Модель Gemma 4 демонстрирует высокий рейтинг Arena ELO при значительно меньшем количестве параметров, чем ведущие модели. Источник: Google

Всё это работает более чем на 140 языках, и независимо от того, какой язык вы используете, Gemma 4 может обрабатывать огромное количество слов. Окно контекста для моделей на периферии теперь составляет 128 тысяч токенов, а для моделей 26B и 31B — 256 тысяч. Этого достаточно для локальной модели, но облачные модели Gemini гораздо щедрее, предоставляя 1 миллион токенов контекста.

Все заявленные улучшения производительности — это хорошо, но, возможно, наиболее важным изменением для Gemma является изменение в лицензировании. Предыдущие версии открытых моделей Google поставлялись с собственной лицензией Google, которую многие разработчики считали слишком ограничительной. Лицензия Gemma 3 содержала строгую политику запрещенного использования, которую Google могла обновлять в одностороннем порядке, и требовала от разработчиков соблюдения правил Google во всех проектах, основанных на Gemma. Ее даже можно было интерпретировать как перенос лицензии на другие модели ИИ, созданные с использованием синтетических данных, полученных с помощью Gemma. Это вызывало у многих разработчиков опасения по поводу использования открытых моделей Google.

В сравнении с этим, Apache 2.0 гораздо более либерален, без навязчивых условий использования или коммерческих ограничений. Разработчики знакомы с Apache и чувствуют себя с ним комфортно, и Google не может просто так решить, что лицензия будет работать по-другому в будущем. Google считает, что предоставление разработчикам большего контроля над своими данными и планами развертывания таким образом побудит их использовать Gemma для большего количества проектов и расширить то, что компания настаивает называть «Gemmaverse».

Скоро появится новая нано-модель.

Выпуск E2B и E4B также демонстрирует, в каком направлении Google движется в своих усилиях по развитию искусственного интеллекта в смартфонах. В телефонах Google Pixel и некоторых других моделях используется локальный ИИ, известный как Gemini Nano. Именно благодаря ему эти телефоны Android могут обнаруживать телефонные и текстовые мошенничества, составлять краткие заметки или создавать сводки телефонных звонков, не отправляя ваши данные в облако. Представитель Google отмечает, что Gemini Nano всегда создавался на основе моделей Gemma, но это особенно верно для обновления следующего поколения до Gemini Nano 4.

Это первый случай, когда Google подтвердила выпуск обновленной версии своей минимальной модели искусственного интеллекта для смартфонов. Текущая модель Gemini Nano 3, работающая на телефонах Pixel, основана на Gemma 3n, но Google подтвердила Ars Technica, что следующее поколение Nano 4 будет иметь варианты 2B и 4B на базе Gemma 4 E2B и E4B.

Компания приглашает разработчиков начать прототипирование рабочих процессов агентов в последней предварительной версии AI Core Developer Preview с моделями Gemma E2B и E4B. Системы, разработанные с использованием этих новых моделей, будут обратно совместимы с Gemini Nano 4 после его запуска. Возможно, мы узнаем об этом подробнее на конференции I/O через несколько недель.

Новые модели Gemma можно сразу же протестировать в AI Studio (31B и 26B MoE) и AI Edge Gallery (E4B и E2B). Весовые коэффициенты моделей также можно загрузить полностью с Hugging Face, Kaggle и Ollama. Хотя модели оптимизированы для локальной обработки, Google также с удовольствием запустит их для вас в Google Cloud за определенную плату.

Источник: arstechnica.com

✅ Найденные теги: Apache 2.0, Gemma, Google, искусственный интеллект, Лицензия, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Мужчина в очках и с короткой стрижкой сидит рядом с окном и наслаждается солнечным светом.
Карта памяти SanDisk Extreme PRO 2TB на столе перед черным кейсом.
Космонавт работает на борту космической станции, окружённый оборудованием и проводами.
Древний океан с причудливыми существами эдиакарского периода на дне.
Капли дождя падают на землю, образуя брызги на мокрой почве.
Капли дождя падают на землю, создавая брызги на мокрой почве.
Вид на Землю из космоса через иллюминатор с силуэтом наблюдающего человека.
Робот-гуманоид Tesla с черной головой и белым туловищем на фоне.
Два персонажа сражаются световыми мечами на темном фоне сцены из фильма.
Image Not Found
Мужчина в очках и с короткой стрижкой сидит рядом с окном и наслаждается солнечным светом.

Как сохранить молодость и увеличить продолжительность жизни?!

Вопрос сохранения молодости и увеличения продолжительности жизни — это, наверное, одна из главных целей современной науки и философии. Сейчас мы подходим к этому не с точки зрения магии, а с точки зрения биохакинга, доказательной медицины и понимания…

Апр 9, 2026
Карта памяти SanDisk Extreme PRO 2TB на столе перед черным кейсом.

Карта памяти SanDisk Extreme Pro UHS-II на 2 Тбайта оценена в $2000

SanDisk незаметно выпустила более ёмкостную версию своей карты памяти Extreme Pro UHS-II, но привлекла она внимание не возможностями, которые мы всё же затронем, а ценником, который выглядит крайне неприятно. Согласно страничке на Amazon, новинка имеет интерфейс SDXC…

Апр 9, 2026
Вид на Землю из космоса через иллюминатор с силуэтом наблюдающего человека.

Сегодня астронавты миссии «Артемида-2» установят новый рекорд расстояния от Земли.

Во время полета космического корабля «Орион» вокруг Луны экипаж «Артемиды II» побьет рекорд, установленный «Аполлоном-13» в 1970 году. Эндрю Лишевски, старший репортер отдела новостей. Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и…

Апр 9, 2026
Археологическая находка: каменная гробница и скелет в древнем сооружении.

Исследование древнего индивида из Переславля-Залесского указало на его генетически смешанное происхождение

саркофаг V и погребение: А – вид с востока; Б – саркофаг V после снятия погребения и поздней плиты, вид сверху. © ИОГен РАН Археогенетическое исследование погребения из саркофага XIV-XV века в Спасо-Преображенском соборе в Переславле-Залесском показало,…

Апр 9, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых