Можно ли интегрировать с WordPress?

Да, мы используем REST API и Application Passwords — без передачи логина и пароля. Все публикации идут от имени автора.

Работает ли ИИ с Telegram?

Полностью. ИИ может как читать каналы, так и публиковать в ваш канал. Также подключаем inline-ботов и формы сбора лидов.

Сколько времени занимает настройка?

От 3 до 7 дней. Зависит от сложности интеграции и количества источников.

Есть ли бесплатный демо-доступ?

Да, мы запускаем 5–7 дневный демо-доступ с тестовыми данными, чтобы вы увидели систему в работе.

Безопасна ли система?

Да. Все данные хранятся изолированно. Мы не используем их для обучения моделей. Поддерживаем шифрование и резервное копирование.

Что входит в поддержку?

Обновление агентов, добавление источников, исправление ошибок, масштабирование. Поддержка 24/7 по Telegram или email.

Иллюстрация: робот отвечает на вопросы о Париже, Франция.

Исследователи обнаружили недостаток, делающий LLM менее надежными.

Мар 5, 2026 0

Крупные языковые модели могут научиться ошибочно связывать определенные шаблоны предложений с конкретными темами — и затем могут повторять эти шаблоны вместо того, чтобы рассуждать. В облачке с репликой спрашивается: Где находится Париж? Робот отвечает: Франция! В облачке с репликой задается бессмысленный вопрос: Быстро сядьте в Париж? Робот отвечает: Франция! Студент магистратуры может узнать, что вопрос типа «Где находится Париж?» имеет структуру наречие/глагол/имя собственное/глагол. Если модели задать новый вопрос с той же грамматической структурой, но бессмысленными словами, например, «Быстро сядь, Париж затянут облаками?», она может ответить «Франция», хотя этот ответ не имеет смысла. Изображение: MIT News; iStock

Согласно исследованию Массачусетского технологического института, большие языковые модели (LLM) иногда усваивают неверные уроки.

Вместо того чтобы отвечать на запрос, опираясь на знания предметной области, модель LLM может использовать грамматические шаблоны, изученные в процессе обучения. Это может привести к неожиданным сбоям модели при применении к новым задачам.

Исследователи обнаружили, что модели могут ошибочно связывать определенные шаблоны предложений с конкретными темами, поэтому модель LLM может дать убедительный ответ, распознав знакомую формулировку, вместо того чтобы понять сам вопрос.

Их эксперименты показали, что даже самые мощные LLM-системы могут допустить эту ошибку.

Этот недостаток может снизить надежность программ LLM, выполняющих такие задачи, как обработка запросов клиентов, составление кратких обзоров клинических данных и формирование финансовых отчетов.

Это также может представлять угрозу безопасности. Злоумышленник может использовать это, чтобы обманом заставить моделей создавать вредоносный контент, даже если у моделей есть средства защиты, предотвращающие подобные реакции.

После выявления этого явления и изучения его последствий исследователи разработали процедуру сравнительной оценки, позволяющую определить зависимость модели от этих некорректных корреляций. Эта процедура может помочь разработчикам решить проблему до внедрения моделей с линейными зависимостями.

«Это побочный продукт того, как мы обучаем модели, но сейчас модели используются на практике в критически важных с точки зрения безопасности областях, выходящих далеко за рамки задач, которые привели к этим синтаксическим ошибкам. Если вы, как конечный пользователь, не знакомы с обучением моделей, это, вероятно, покажется вам неожиданным», — говорит Марзие Гассеми, доцент кафедры электротехники и компьютерных наук Массачусетского технологического института (ITES), член Института медицинских инженерных наук MIT и Лаборатории информационных и систем принятия решений, а также старший автор исследования.

К Гассеми присоединились соавторы Шанталь Шаиб, аспирантка Северо-восточного университета и приглашенный студент Массачусетского технологического института; и Винит Суриякумар, аспирант Массачусетского технологического института; а также Левент Сагун, научный сотрудник компании Meta; и Байрон Уоллес, междисциплинарный доцент имени Си и Лори Стернберг и заместитель декана по исследованиям в Колледже компьютерных наук имени Хури Северо-восточного университета. Доклад с описанием работы будет представлен на конференции по нейронным системам обработки информации.

Застрял на синтаксисе

Модели LLM обучаются на огромном количестве текста из интернета. В процессе обучения модель учится понимать взаимосвязи между словами и фразами — знания, которые она использует позже при ответе на запросы.

В предыдущих работах исследователи обнаружили, что LLM-ы улавливают закономерности в частях речи, которые часто встречаются вместе в обучающих данных. Они называют эти закономерности частей речи «синтаксическими шаблонами».

Для ответа на вопросы в конкретной области знаний магистрам права необходимо понимание синтаксиса наряду с семантическими знаниями.

«Например, в новостной сфере существует определенный стиль письма. Поэтому модель изучает не только семантику, но и базовую структуру того, как предложения должны быть составлены, чтобы соответствовать определенному стилю в данной области», — объясняет Шаиб.

Однако в ходе этого исследования было установлено, что модели с линейной структурой обучаются связывать эти синтаксические шаблоны с конкретными областями знаний. Модель может ошибочно полагаться исключительно на эту усвоенную ассоциацию при ответе на вопросы, а не на понимание запроса и предмета исследования.

Например, модель LLM может узнать, что вопрос типа «Где находится Париж?» имеет структуру наречие/глагол/имя собственное/глагол. Если в обучающих данных модели много примеров таких предложений, модель LLM может связать этот синтаксический шаблон с вопросами о странах.

Таким образом, если модели задать новый вопрос с той же грамматической структурой, но бессмысленными словами, например: «Быстро сядет Париж в облаках?», она может ответить «Франция», даже если этот ответ не имеет смысла.

«Это тот тип ассоциаций, который часто упускается из виду, и который модель изучает, чтобы правильно отвечать на вопросы. Нам следует уделять больше внимания не только семантике, но и синтаксису данных, которые мы используем для обучения наших моделей», — говорит Шаиб.

Не уловить смысл

Исследователи проверили это явление, разработав синтетические эксперименты, в которых в обучающих данных модели для каждой предметной области присутствовал только один синтаксический шаблон. Они тестировали модели, заменяя слова синонимами, антонимами или случайными словами, но сохраняя базовый синтаксис неизменным.

В каждом случае они обнаружили, что студенты магистратуры часто давали правильный ответ, даже когда вопрос был полным абсурдом.

Когда студенты, изучающие английский как второй язык, переформулировали тот же вопрос, используя новую модель частей речи, они часто не давали правильного ответа, хотя основной смысл вопроса оставался тем же.

Они использовали этот подход для тестирования предварительно обученных моделей LLM, таких как GPT-4 и Llama, и обнаружили, что такое же усвоенное поведение значительно снижает их производительность.

Заинтересовавшись более широкими последствиями этих выводов, исследователи изучили, можно ли использовать это явление для того, чтобы вызвать негативную реакцию у человека с ограниченными возможностями обучения, которого специально обучили отказываться от подобных просьб.

Они обнаружили, что, сформулировав вопрос с использованием синтаксического шаблона, который модель связывает с «безопасным» набором данных (не содержащим вредоносной информации), они могли обмануть модель, заставив её игнорировать политику отказа и сгенерировать вредоносный контент.

«Из этой работы мне стало ясно, что нам нужны более надежные средства защиты от уязвимостей в языках с лингвистическим обучением. В этой статье мы выявили новую уязвимость, возникающую из-за особенностей обучения в языках с лингвистическим обучением. Поэтому нам необходимо разработать новые средства защиты, основанные на том, как языки с лингвистическим обучением изучаются, а не просто использовать ситуативные решения для различных уязвимостей», — говорит Суриякумар.

Хотя в данной работе исследователи не рассматривали стратегии смягчения последствий, они разработали автоматизированный метод сравнительной оценки, который можно использовать для оценки зависимости модели LLM от этой некорректной корреляции синтаксиса и предметной области. Этот новый тест может помочь разработчикам заблаговременно устранить этот недостаток в своих моделях, снизив риски для безопасности и повысив производительность.

В будущем исследователи планируют изучить потенциальные стратегии смягчения последствий, которые могут включать расширение обучающих данных для предоставления более широкого спектра синтаксических шаблонов. Они также заинтересованы в изучении этого явления в моделях рассуждений — особых типах линейных моделей рассуждений, предназначенных для решения многоэтапных задач.

«Я думаю, это действительно креативный подход к изучению причин отказов LLM. Эта работа подчеркивает важность лингвистических знаний и анализа в исследованиях безопасности LLM, аспект, который до сих пор не был в центре внимания, но, безусловно, должен быть», — говорит Джесси Ли, доцент Техасского университета в Остине, которая не принимала участия в этой работе.

Данная работа частично финансируется за счет стипендии Bridgewater AIA Labs Fellowship, Национального научного фонда, Фонда Гордона и Бетти Мур, исследовательской премии Google и компании Schmidt Sciences.

Источник: news.mit.edu

✅ Найденные теги: LLM, Исследователи, Надежность, Недостаток, новости

Метки:

Иллюстрация анализа кожных заболеваний с помощью нейросети на экране смартфона.

ПРЕДЫДУЩАЯ ЗАПИСЬ

05.03.2026

AMIE обретает видение: исследовательский агент искусственного интеллекта для многомодального диагностического диалога.

СЛЕДУЮЩАЯ ЗАПИСЬ

05.03.2026

Анализ причинно-следственных связей выявляет различные вычислительные архитектуры в базовых моделях отдельных клеток: ингибиторное доминирование, биологическая когерентность и сходимость между моделями.

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

Женщина с чашкой чая сидит на диване, наслаждаясь утренним солнцем в гостиной.

Правительство Великобритании поддерживает развитие медицинских технологий в рамках новой программы доступа к медицинским технологиям для Национальной службы здравоохранения (NHS) — Сеть медицинских устройств.

Руководители обсуждают, как ИИ меняет структуру рабочей силы в здравоохранении, часть 2 | MobiHealthNews

Искусственный интеллект в медицинской визуализации, ожидание процесса.

Без шуток: НАСА планирует запуск миссии Artemis II на Луну 1 апреля.

Изображение улыбающегося мужчины на фоне художественного рисунка.

НОВОСТИ ДРУГИХ РУБРИК

Архив рубрики ~Лента новостей~

Ваш утренний кофе однажды может помочь в борьбе с раком.

Новая система редактирования генов использует кофеин в качестве триггера, позволяя ученым активировать CRISPR внутри модифицированных клеток — и даже активировать Т-клетки, борющиеся с раком. Изображение: Shutterstock Может ли такой распространенный продукт, как кофе, сыграть роль в лечении…

ЧИТАТЬ

Мар 6, 2026

Архив рубрики ~Лента новостей~

Правительство Великобритании поддерживает развитие медицинских технологий в рамках новой программы доступа к медицинским технологиям для Национальной службы здравоохранения (NHS) — Сеть медицинских устройств.

Британский орган по надзору за здравоохранением NICE теперь будет проводить анализ соотношения затрат и выгод медицинских устройств, диагностических средств и цифровых инструментов здравоохранения. Изображение предоставлено: lunopark через ShutterStock.com. Правительство Великобритании поставило перед собой цель улучшить доступ к…

ЧИТАТЬ

Мар 6, 2026

Архив рубрики ~Лента новостей~

Анализ масштабных сокращений в биотехнологических компаниях в 2026 году: Alltrna сокращает 19 рабочих мест; Theravance уменьшает численность персонала вдвое.

Добро пожаловать в пятый ежегодный отчет Fierce Biotech о сокращениях штата, ресурс, разработанный для того, чтобы следить за постоянным потоком сокращений в отрасли. В 2025 году количество увольнений в отрасли продолжало расти из года в год, что…

ЧИТАТЬ

Мар 6, 2026

Архив рубрики ~Лента новостей~

Руководители обсуждают, как ИИ меняет структуру рабочей силы в здравоохранении, часть 2 | MobiHealthNews

Лидеры утверждают, что ИИ изменит структуру рабочих мест, не заменив при этом человеческий фактор в сфере ухода. ИИ Фото: Pekic/Getty Images Руководители медицинских учреждений заявили MobiHealthNews, что искусственный интеллект готов трансформировать здравоохранение, автоматизируя административные задачи и освобождая…

ЧИТАТЬ

Мар 6, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO

Исследователи обнаружили недостаток, делающий LLM менее надежными.

Похожие записи

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ Отменить ответ

Еще новости рубрики

Присоединяйтесь к нам в

Рубрики

галерея

НОВОСТИ ДРУГИХ РУБРИК

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Присоединяйтесь
к нам в