Image

Малые языковые модели: 10 прорывных технологий 2025 года

Большие языковые модели раскрыли потенциал ИИ. Теперь пришло время более эффективным ИИ взять верх.

рука с крошечной пишущей машинкой

Дизайн Селмана

ВОЗ

Институт Аллена по искусственному интеллекту, Anthropic, Google, Meta, Microsoft, OpenAI

КОГДА

Сейчас

Не заблуждайтесь: размер имеет значение в мире ИИ. Когда OpenAI запустила GPT-3 в 2020 году, это была самая большая языковая модель из когда-либо созданных. Компания продемонстрировала, что сверхбольшой размер модели такого типа достаточно для заоблачного роста производительности. Это положило начало технологическому буму, который с тех пор поддерживается более крупными моделями. Как заявил Ноам Браун, научный сотрудник OpenAI, выступая на конференции TEDAI в Сан-Франциско в октябре: «Невероятный прогресс в области ИИ за последние пять лет можно описать одним словом: масштаб».

Но поскольку незначительный прирост производительности новых высококлассных моделей снижается, исследователи ищут способы сделать больше с меньшими ресурсами. Для некоторых задач модели меньшего размера, обученные на более специализированных наборах данных, теперь могут выполнять задачи не хуже, а то и лучше, чем модели большего размера. Это настоящее благо для компаний, стремящихся внедрить ИИ в ограниченном количестве специализированных приложений. Вам не нужен весь интернет в вашей модели, если вы снова и снова отправляете одни и те же запросы.

Как настроить ИИ для процветания

Искусственный интеллект может вывести нас на путь экономического процветания, но для этого потребуются серьезные корректировки курса.

Большинство крупных технологических компаний теперь предлагают уменьшенные версии своих флагманских моделей для этой цели: OpenAI предлагает GPT-4o и GPT-4o mini; Google DeepMind — Gemini Ultra и Gemini Nano; а Claude 3 от Anthropic выпускается в трёх вариантах: большой Opus, средний Sonnet и крошечный Haiku. Microsoft является пионером в разработке серии небольших языковых моделей под названием Phi.

Всё больше компаний малого бизнеса предлагают небольшие модели. Стартап в области искусственного интеллекта Writer утверждает, что его новейшая языковая модель не уступает по эффективности крупнейшим моделям высшего уровня по многим ключевым показателям, хотя в некоторых случаях число параметров (значений, которые рассчитываются во время обучения и определяют поведение модели) в два раза меньше.

Ознакомьтесь с полным списком 10 прорывных технологий 2025 года.

Модели меньшего размера более эффективны, что позволяет быстрее тренироваться и работать на них. Это хорошая новость для тех, кто ищет более доступный вариант для старта. И это может быть полезно для климата: поскольку модели меньшего размера работают с гораздо меньшей вычислительной мощностью, чем их гигантские собратья, они потребляют меньше энергии.

Эти небольшие модели также удобны для путешествий: они могут работать прямо у нас в кармане, без необходимости отправлять запросы в облако. Компактность — это следующий большой шаг.

2025

10 прорывных технологий

Источник: www.technologyreview.com

✅ Найденные теги: Малые, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых