Архив рубрики ~Лента новостей~

Самая компактная модель Liquid AI, LFM2.5-230M, превосходит модели в 4 раза большего размера по эффективности извлечения данных и может работать «где угодно».

Самая компактная модель Liquid AI, LFM2.5-230M, превосходит модели в 4 раза большего размера по эффективности извлечения данных и может работать «где угодно».
Самая компактная модель Liquid AI, LFM2.5-230M, превосходит модели в 4 раза большего размера по эффективности извлечения данных и может работать «где угодно».

Карл Франзен

Компания Liquid AI, основанная бывшими учеными-компьютерщиками из Массачусетского технологического института, сегодня выпустила свою самую маленькую на сегодняшний день языковую модель для ИИ — LFM2.5-230M, и предприятиям стоит рассмотреть ее для использования в извлечении данных и локальном развертывании на смартфонах, ноутбуках и робототехнике.

Это базовая модель с 230 миллионами параметров, специально разработанная для рабочих процессов агентов на устройствах, и, как заявляет Liquid в своем сообщении в блоге о выпуске, такой небольшой размер позволяет запускать ее практически «где угодно». По данным Liquid, она также превосходит модели, более чем в 4 раза превышающие ее размер, по некоторым показателям, в частности, демонстрируя лучшие результаты в извлечении данных, чем Alibaba Qwen3.5-0.8B (Instruct) с 800 миллионами параметров и Google Gemma 3 1B с 1 миллиардом параметров.

Сравнительная таблица результатов тестов Liquid AI LFM2.5-230M

Данная модель ориентирована на разработчиков и инженеров, создающих легковесные конвейеры извлечения данных и автономные периферийные системы.

Работая по коммерческой лицензии двойного назначения, эта модель остается бесплатной для частных лиц и компаний с годовым доходом менее 10 миллионов долларов, в то время как для более крупных корпораций требуется платное корпоративное соглашение.

Эта версия отличается от других небольших моделей ИИ тем, что использует архитектуру LFM2 для достижения высокой скорости вывода без значительных накладных расходов на память, характерных для трансформеров с большим количеством параметров.

В то время как крупнейшие компании в сфере ИИ, такие как Anthropic, OpenAI, Google, Microsoft, Meta и другие, увеличивают количество параметров до сотен миллиардов или триллионов для достижения передовых показателей производительности, параллельная гонка полностью сосредоточена на периферийных и локальных развертываниях.

Запуск Liquid AI модели LFM2.5-230M знаменует собой поворотный момент в сторону архитектурной эффективности вместо грубого масштабирования. Уместив 19 триллионов токенов предварительного обучения в систему с 230 миллионами параметров, компания демонстрирует, что периферийным устройствам не требуется огромная вычислительная мощность или постоянные облачные соединения для выполнения сложных многоэтапных агентных рабочих процессов.

Как работает LFM2.5-230M

Модель LFM2.5-230M отличается от стандартных архитектур трансформеров, опираясь вместо этого на структуру LFM2. Эта архитектура функционирует как гибридная система, чередуя управляемые свертки ближнего действия с механизмом внимания, основанным на групповых запросах, для эффективной обработки информации.

Для тех, кто следит за развитием эффективных архитектур, подход Liquid преследует схожую концептуальную цель: эффективное управление длинными контекстами и последовательными данными на периферийном оборудовании без квадратичных затрат памяти, характерных для механизмов внимания. Модель поддерживает обширное контекстное окно размером 32 КБ, что позволяет ей обрабатывать как объемные документы, так и непрерывные потоки телеметрии роботов.

При анализе представленных в релизе графиков производительности становится очевидной архитектурная эффективность. Модель поддерживает объем используемой памяти менее 400 МБ, при этом достигая скорости предварительного заполнения и декодирования, превосходящей аналогичные модели, такие как Gemma 3 1B IT и Granite 4.0-H-350M.

На Samsung Galaxy S25 Ultra, оснащенном процессором Qualcomm Snapdragon Gen4, модель достигает скорости декодирования 213 токенов в секунду. Даже на сильно ограниченном по ресурсам Raspberry Pi 5 модель поддерживает скорость декодирования 42 токена в секунду. Кроме того, внутренние тесты показывают, что стек обработки данных на графическом процессоре обеспечивает меньшую сквозную задержку, чем конкурирующие небольшие модели на всех уровнях параллелизма.

Почему это важно для предприятий

Чтобы понять, почему необходима модель с 230 миллионами параметров, нужно взглянуть на то, как предприятия в настоящее время управляют данными.

Традиционно организации полагались на жесткие, основанные на правилах скрипты извлечения, преобразования и загрузки (ETL) для перемещения и обработки данных. Однако эти устаревшие системы, как известно, очень ненадежны; простое изменение структуры документа или обновление схемы может нарушить весь конвейер обработки данных.

Для решения этой проблемы отрасль переходит к «ИИ ETL», где машинное обучение определяет соответствия, обнаруживает изменения в схеме и автоматически адаптируется к ним. В современном облегченном конвейере извлечения данных модель ИИ подключается к неструктурированным источникам — таким как PDF-файлы, электронные письма или веб-формы — и структурирует данные в форматы, например, JSON, без необходимости жестко закодированных правил.

Для крупных предприятий использование такой масштабной флагманской модели, как Claude Opus 4.6 (стоимость которой составляет 5 долларов за миллион входных токенов), для анализа стандартных счетов-фактур, форматирования адресов или маршрутизации телеметрических данных экономически нецелесообразно.

Именно здесь модели, подобные LFM2.5-230M, становятся критически важными. Разработанная специально как легковесный механизм извлечения данных, она позволяет компаниям автоматизировать повторяющиеся операции форматирования и анализа данных с минимальными вычислительными затратами и задержкой, работая непосредственно на локальном оборудовании, а не полагаясь на дорогостоящие и непрерывные вызовы облачных API.

Сравнительный анализ малогабаритных моделей: LFM против класса 3B.

В середине 2026 года в индустрии искусственного интеллекта наблюдается возрождение «небольших» моделей, однако определение «небольшой» модели сильно различается.

Недавно сообщество разработчиков открытых весов было поражено моделью VibeThinker-3B от Weibo, обладающей 3 миллиардами параметров и построенной на архитектуре типа Qwen2, которая достигла впечатляющего результата в 94,3 балла на математическом бенчмарке AIME 2026, соперничая с гигантами, обладающими 600 миллиардами параметров, благодаря агрессивной обработке данных и обучению с подкреплением.

Аналогичным образом, семейство Gemma 4 от Google, которое недавно преодолело отметку в 200 миллионов загрузок, выводит передовые технологии искусственного интеллекта на передовые позиции, включая E2B (2 миллиарда параметров), разработанный специально для мобильных устройств и Интернета вещей.

В отличие от них, Liquid AI LFM2.5-230M работает в совершенно другом весовом классе. Имея всего 230 миллионов параметров, он примерно в десять раз меньше самой маленькой модели Google Gemma 4 и VibeThinker-3B.

Из-за своих микроскопических размеров LFM2.5-230M не предназначен для работы с ресурсоемкими задачами, требующими логического мышления, такими как сложная математика, программирование или написание сочинений — ограничение, которое Liquid AI прямо признает.

Однако в тех областях, для которых она предназначена — извлечении данных и вызове инструментов — модель демонстрирует результаты, значительно превосходящие ожидания.

Опубликованные Liquid AI результаты тестов показывают, что LFM2.5-230M набрал 43,26 балла в бенчмарке BFCLv3, превосходя по этому показателю Granite 4.0-350M от IBM (39,58) и полностью опережая более крупные модели с миллиардом параметров, такие как Gemma 3 1B IT от Google (16,61).

Сравнительная диаграмма результатов тестирования Liquid AI LFM2.5-230M

В тесте CaseReportBench на извлечение данных он получил оценку 22,51, значительно превзойдя показатель Qwen3,5-0,8B (Instruct).

LFM2.5-230M доказывает, что, хотя модели с 3 миллиардами параметров, такие как VibeThinker, решают сложные задачи математического анализа, модель с 230 миллионами параметров является превосходным, высокооптимизированным выбором для выполнения структурированных вызовов инструментов и обеспечения эффективной работы агентных конвейеров на оборудовании с ограниченными ресурсами.

Передовые методы исследований

Благодаря своей превосходной способности вызывать инструменты, LFM2.5-230M функционирует в первую очередь как слой выбора навыков. Компания Liquid AI продемонстрировала эту возможность, развернув модель на человекоподобном роботе Unitree G1.

Работая полностью на устройстве с помощью встроенного в робот вычислительного модуля NVIDIA Jetson Orin, модель успешно обрабатывает сложные команды управления окружающей средой.

Как отмечается в техническом блоге компании, модель принимает произвольную инструкцию, например: *«Замри в течение 2 секунд, затем иди вперед со скоростью 1 метр в секунду на расстояние 3 метра, удержись в положении на коленях на одной ноге в течение 5 секунд и иди назад со скоростью 0,5 метра в секунду на расстояние 3 метра»*, и автоматически преобразует ее в структурированный многоэтапный план, использующий предварительно обученные низкоуровневые навыки, предоставляемые фреймворком SONIC от NVIDIA.

Базовые и постобученные модели доступны сразу же на Hugging Face, с поддержкой с первого дня во всей экосистеме вывода для llama.cpp (GGUF), MLX, vLLM, SGLang и ONNX.

Лицензия LFM с двойным назначением и возможностью индивидуальной настройки

Liquid AI распространяет LFM2.5-230M под лицензией LFM Open License v1.0. Несмотря на слово «открытый» в названии, эта лицензия не соответствует требованиям Open Source Initiative (OSI); она функционирует как ограниченная коммерческая платформа двойного назначения.

Для независимых разработчиков, исследователей и стартапов на ранних стадиях лицензия функционирует идентично программному обеспечению с открытым исходным кодом.

Пользователи получают бессрочную, всемирную, безвозмездную лицензию на воспроизведение, изменение и распространение модели при условии сохранения оригинальных уведомлений об авторских правах и четкого указания на любые внесенные изменения.

Однако лицензия включает в себя строгое «ограничение на коммерческое использование». Любое юридическое лицо, годовой доход которого составляет 10 миллионов долларов или более, теряет право на коммерческое использование модели в соответствии с данным соглашением.

Крупные предприятия, превысившие этот финансовый порог, должны заключить отдельное платное коммерческое соглашение с Liquid AI для внедрения модели в производство.

Эта стратегия защищает компанию от бесплатного поглощения ее интеллектуальной собственности крупными технологическими конгломератами, одновременно способствуя развитию модели на низовом уровне среди разработчиков.

Transform: Посмотрите, кто участвует в CTA

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly AGI Weekly Еженедельник по безопасности Еженедельник по инфраструктуре данных Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Коротко из Telegram~ OpenPencil — бесплатный Claude Design на вашем компьютере Вышел OpenPencil… Архив рубрики ~Коротко из Telegram~ В Москве ИИ начал заполнять медкарты вместо врачей — в… Архив рубрики ~Коротко из Telegram~ И на выжженном яблочном поле останутся одни лишь веб-приложения Владельцев… Архив рубрики ~Коротко из Telegram~ По данным исследования «Зерокодера», в феврале 2026 года DeepSeek вышел… Архив рубрики ~Коротко из Telegram~ ➡️ Anthropic представила Enterprise-managed Authorization — новый механизм, который позволяет… Архив рубрики ~Коротко из Telegram~ ИИ-музыку почти никто не слушает В новом исследовании изучили Spotify… Новости робототехники Robust.AI выбирает датчик Aptiv PULSE для местной роботы Carter третьего поколения Новости робототехники Hirebotics предлагает взрывозащищенный кобот для покраски без кода Новости робототехники Великие роботы, компании-неудачники: основы бизнеса, стартапы по автоматизации для получения результатов Архив рубрики ~Обо всем~ 10 технологий, которые были “убийцами всего”, но провалились Новости робототехники Институт расширения ARM RoboticsCareer.org за счет физического искусственного интеллекта Архив рубрики ~Обо всем~ Машины, созданные по образцу работы мозга, справляются с математикой лучше, чем ожидалось. Новости робототехники Демонстрация роботизированных технологий НАСА позволит усовершенствовать прототипы детекторов гамма-излучения. Архив рубрики ~Обо всем~ 70% компаний, внедряющих ИИ-агентов для обслуживания клиентов, видят окупаемость инвестиций в течение 60 дней. Архив рубрики ~Коротко из Telegram~ OpenPencil — бесплатный Claude Design на вашем компьютере Вышел OpenPencil… Архив рубрики ~Коротко из Telegram~ В Москве ИИ начал заполнять медкарты вместо врачей — в… Архив рубрики ~Коротко из Telegram~ И на выжженном яблочном поле останутся одни лишь веб-приложения Владельцев… Архив рубрики ~Коротко из Telegram~ По данным исследования «Зерокодера», в феврале 2026 года DeepSeek вышел… Архив рубрики ~Коротко из Telegram~ ➡️ Anthropic представила Enterprise-managed Authorization — новый механизм, который позволяет… Архив рубрики ~Коротко из Telegram~ ИИ-музыку почти никто не слушает В новом исследовании изучили Spotify… Новости робототехники Robust.AI выбирает датчик Aptiv PULSE для местной роботы Carter третьего поколения Новости робототехники Hirebotics предлагает взрывозащищенный кобот для покраски без кода Новости робототехники Великие роботы, компании-неудачники: основы бизнеса, стартапы по автоматизации для получения результатов Архив рубрики ~Обо всем~ 10 технологий, которые были “убийцами всего”, но провалились Новости робототехники Институт расширения ARM RoboticsCareer.org за счет физического искусственного интеллекта Архив рубрики ~Обо всем~ Машины, созданные по образцу работы мозга, справляются с математикой лучше, чем ожидалось. Новости робототехники Демонстрация роботизированных технологий НАСА позволит усовершенствовать прототипы детекторов гамма-излучения. Архив рубрики ~Обо всем~ 70% компаний, внедряющих ИИ-агентов для обслуживания клиентов, видят окупаемость инвестиций в течение 60 дней.

Оставить комментарий