Абстрактный узор на черном фоне с текстом "Gemma 4" в центре.

Google объявляет об открытии 4 моделей искусственного интеллекта под управлением Gemma и переходе на лицензию Apache 2.0.

Gemma 4 представляет собой первое крупное обновление открытых моделей Google за год.

Логотип героя Джеммы 4 Источник: Google Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию

За последний год модели искусственного интеллекта Gemini от Google значительно улучшились, но использовать Gemini можно только на условиях Google. Модели Gemma с открытыми весами предоставили больше свободы, но Gemma 3, запущенная более года назад, уже немного устарела. Начиная с сегодняшнего дня, разработчики могут начать работать с Gemma 4, которая доступна в четырех размерах, оптимизированных для локального использования. Google также признала недовольство разработчиков лицензированием ИИ, поэтому отказывается от пользовательской лицензии Gemma.

Как и в предыдущих версиях своих моделей с открытыми весами, Google разработала Gemma 4 таким образом, чтобы её можно было использовать на локальных машинах. Это, конечно, может означать многое. Два больших варианта Gemma, 26B Mixture of Experts и 31B Dense, предназначены для работы без квантования в формате bfloat16 на одном 80-гигабайтном графическом процессоре Nvidia H100. Конечно, это ускоритель ИИ стоимостью 20 000 долларов, но это всё ещё локальное оборудование. Если квантовать для работы с более низкой точностью, эти большие модели поместятся на потребительских графических процессорах.

Google также утверждает, что сосредоточилась на снижении задержки, чтобы в полной мере использовать преимущества локальной обработки Gemma. Модель 26B Mixture of Experts активирует в режиме вывода только 3,8 миллиарда из своих 26 миллиардов параметров, что обеспечивает ей гораздо более высокую производительность (токенов в секунду), чем у моделей аналогичного размера. Между тем, модель 31B Dense больше ориентирована на качество, чем на скорость, но Google ожидает, что разработчики будут дорабатывать её для конкретных задач.

Что нового в 4-й серии «Джеммы»?

Две другие модели Gemma 4, Effective 2B (E2B) и Effective 4B (E4B), предназначены для мобильных устройств. Эти варианты разработаны для поддержания низкого уровня использования памяти во время выполнения инференции, работая с эффективным количеством параметров в 2 миллиарда или 4 миллиарда. Google заявляет, что команда Pixel тесно сотрудничала с Qualcomm и MediaTek для оптимизации этих моделей для таких устройств, как смартфоны, Raspberry Pi и Jetson Nano. Они не только потребляют меньше памяти и заряда батареи, чем Gemma 3, но Google также заявляет о «практически нулевой задержке» в этот раз.

Более мощный, более открытый

По сообщениям, все новые модели Gemma 4 значительно превзойдут Gemma 3 — Google утверждает, что это самые производительные модели, которые можно запустить на локальном оборудовании. Google заявляет, что Gemma 31B дебютирует на третьем месте в списке лучших открытых моделей ИИ Arena, после GLM-5 и Kimi 2.5. Однако даже самый большой вариант Gemma 4 значительно меньше этих моделей, что теоретически делает его гораздо дешевле в эксплуатации.

Основанная на той же базовой технологии, что и закрытые модели Google Gemini 3, Gemma 4 предлагает улучшенные возможности рассуждения, математические вычисления и следование инструкциям. За последний год ИИ также сместился в сторону управления рабочими процессами с помощью агентов, и Gemma 4 готова к этим изменениям, поддерживая вызов собственных функций, структурированный вывод JSON и собственные инструкции для распространенных инструментов и API.

Генерация кода также становится ключевым применением генеративного ИИ, и Google утверждает, что Gemma 4 оптимизирована и для этого. Генерировать качественный код можно с помощью множества систем ИИ, но такие высокоэффективные решения, как Gemini Pro и Claude Code, представляют собой облачные сервисы.

Google утверждает, что Gemma 4 может обеспечить аналогично высокое качество кода в автономном режиме, при условии наличия оборудования для запуска более крупных версий. Аналогично, Google заявляет, что Gemma 4 лучше обрабатывает визуальный ввод, что делает такие задачи, как распознавание текста и распознавание диаграмм, более надежными на локальных системах. Эффективные модели E2B и E4B также имеют встроенную поддержку распознавания речи — семейство Gemma 3 также обладало этой функцией, но Google, похоже, подразумевает, что Gemma 4 в этом отношении лучше.

График результатов Arena ELO Модель Gemma 4 демонстрирует высокий рейтинг Arena ELO при значительно меньшем количестве параметров, чем ведущие модели. Источник: Google
Модель Gemma 4 демонстрирует высокий рейтинг Arena ELO при значительно меньшем количестве параметров, чем ведущие модели. Источник: Google

Всё это работает более чем на 140 языках, и независимо от того, какой язык вы используете, Gemma 4 может обрабатывать огромное количество слов. Окно контекста для моделей на периферии теперь составляет 128 тысяч токенов, а для моделей 26B и 31B — 256 тысяч. Этого достаточно для локальной модели, но облачные модели Gemini гораздо щедрее, предоставляя 1 миллион токенов контекста.

Все заявленные улучшения производительности — это хорошо, но, возможно, наиболее важным изменением для Gemma является изменение в лицензировании. Предыдущие версии открытых моделей Google поставлялись с собственной лицензией Google, которую многие разработчики считали слишком ограничительной. Лицензия Gemma 3 содержала строгую политику запрещенного использования, которую Google могла обновлять в одностороннем порядке, и требовала от разработчиков соблюдения правил Google во всех проектах, основанных на Gemma. Ее даже можно было интерпретировать как перенос лицензии на другие модели ИИ, созданные с использованием синтетических данных, полученных с помощью Gemma. Это вызывало у многих разработчиков опасения по поводу использования открытых моделей Google.

В сравнении с этим, Apache 2.0 гораздо более либерален, без навязчивых условий использования или коммерческих ограничений. Разработчики знакомы с Apache и чувствуют себя с ним комфортно, и Google не может просто так решить, что лицензия будет работать по-другому в будущем. Google считает, что предоставление разработчикам большего контроля над своими данными и планами развертывания таким образом побудит их использовать Gemma для большего количества проектов и расширить то, что компания настаивает называть «Gemmaverse».

Скоро появится новая нано-модель.

Выпуск E2B и E4B также демонстрирует, в каком направлении Google движется в своих усилиях по развитию искусственного интеллекта в смартфонах. В телефонах Google Pixel и некоторых других моделях используется локальный ИИ, известный как Gemini Nano. Именно благодаря ему эти телефоны Android могут обнаруживать телефонные и текстовые мошенничества, составлять краткие заметки или создавать сводки телефонных звонков, не отправляя ваши данные в облако. Представитель Google отмечает, что Gemini Nano всегда создавался на основе моделей Gemma, но это особенно верно для обновления следующего поколения до Gemini Nano 4.

Это первый случай, когда Google подтвердила выпуск обновленной версии своей минимальной модели искусственного интеллекта для смартфонов. Текущая модель Gemini Nano 3, работающая на телефонах Pixel, основана на Gemma 3n, но Google подтвердила Ars Technica, что следующее поколение Nano 4 будет иметь варианты 2B и 4B на базе Gemma 4 E2B и E4B.

Компания приглашает разработчиков начать прототипирование рабочих процессов агентов в последней предварительной версии AI Core Developer Preview с моделями Gemma E2B и E4B. Системы, разработанные с использованием этих новых моделей, будут обратно совместимы с Gemini Nano 4 после его запуска. Возможно, мы узнаем об этом подробнее на конференции I/O через несколько недель.

Новые модели Gemma можно сразу же протестировать в AI Studio (31B и 26B MoE) и AI Edge Gallery (E4B и E2B). Весовые коэффициенты моделей также можно загрузить полностью с Hugging Face, Kaggle и Ollama. Хотя модели оптимизированы для локальной обработки, Google также с удовольствием запустит их для вас в Google Cloud за определенную плату.

Источник: arstechnica.com

✅ Найденные теги: Apache 2.0, Gemma, Google, искусственный интеллект, Лицензия, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Обзор продуктов на основе ИИ: новые инструменты для работы медсестер, кодирования и управления доходами.
Марсоход исследует поверхность Марса с помощью манипулятора на каменистой местности.
Ребёнок в жёлтых наушниках и футболке на голубом фоне, слушает музыку.
Ребенок в желтой футболке слушает музыку в наушниках на синем фоне.
Компания TRiCares получила разрешение FDA на начало ключевого клинического исследования лечения трикуспидальной регургитации — Medical Device Network
ideipro logotyp
Женщина пишет на доске с заметками и диаграммами в офисе.
Недоступное изображение, значок графика.
Разборка смартфона: дисплей, батарея и компоненты на белом фоне с инструментами.
Image Not Found
Обзор продуктов на основе ИИ: новые инструменты для работы медсестер, кодирования и управления доходами.

Обзор продуктов на основе ИИ: новые инструменты для работы медсестер, кодирования и управления доходами.

Недавно анонсированные приложения искусственного интеллекта подчеркивают переход к автоматизации, ориентированной на конкретные области, где логическое мышление и нативная интеграция направлены на повышение эффективности и безопасности. Искусственный интеллект Фото: Сесилия Аркурс/Getty Images Недавно анонсированные приложения искусственного интеллекта подчеркивают…

Апр 8, 2026
Марсоход исследует поверхность Марса с помощью манипулятора на каменистой местности.

Впервые на Марсе обнаружены флуоресцентные рубиноподобные камни.

Марсоход Perseverance обнаружил внутри гальки на Марсе крошечные кристаллы, похожие на рубины или сапфиры, — ранее они никогда не наблюдались. Марсоход НАСА «Персеверанс» находится в поисках драгоценных камней. NASA/JPL-Caltech/ASU/MSSS Марсоход «Персеверанс» обнаружил драгоценные камни внутри марсианских камешков.…

Апр 8, 2026
Ребёнок в жёлтых наушниках и футболке на голубом фоне, слушает музыку.

Исследование выявило опасный уровень свинца в детской одежде.

В некоторых детских товарах из сегмента масс-маркета может содержаться опасное количество свинца, особенно в тканях ярких цветов. Источник: Shutterstock Быстрая мода предлагает доступный способ соответствовать потребностям детей, которые быстро вырастают из своей одежды. Однако новые предварительные исследования…

Апр 8, 2026
Ребенок в желтой футболке слушает музыку в наушниках на синем фоне.

Исследование выявило опасный уровень свинца в детской одежде.

В некоторых детских товарах из сегмента масс-маркета может содержаться опасное количество свинца, особенно в тканях ярких цветов. Источник: Shutterstock Быстрая мода предлагает доступный способ соответствовать потребностям детей, которые быстро вырастают из своей одежды. Однако новые предварительные исследования…

Апр 8, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых