Image

Кодированный язык поколения Альфа затрудняет обнаружение интернет-травли

Взрослые и модели искусственного интеллекта не распознают сообщения с вредоносными намерениями, выраженные с использованием сленга или мемов поколения альфа, что вызывает опасения по поводу безопасности молодежи в Интернете

fdf745926d079d374813c984931a995b

Язык подростков может затруднить обнаружение онлайн-травли

Vitapix/Getty Images

Интернет-жаргон поколения Альфа мутирует быстрее, чем успевают учителя, родители и модели искусственного интеллекта, что потенциально подвергает детей издевательствам и травле, которые доверенные взрослые и системы безопасности на основе искусственного интеллекта просто не замечают.

Маниша Мехта, 14-летняя ученица средней школы Уоррена Э. Хайда в Купертино, Калифорния, и Фаусто Джунчилья из Университета Тренто, Италия, собрали 100 выражений и фраз, популярных среди поколения Альфа (людей, родившихся в период с 2010 по 2025 год), из популярных игр, социальных сетей и видеоплатформ.

Затем пара попросила 24 добровольцев в возрасте от 11 до 14 лет, одноклассников Мехты, проанализировать фразы вместе с скриншотами, связанными с контекстом. Добровольцы объяснили, понимают ли они фразы, в каком контексте они используются и несет ли это использование какие-либо потенциальные проблемы безопасности или вредные толкования. Они также попросили родителей, профессиональных модераторов и четыре модели ИИ — GPT-4, Claude, Gemini и Llama 3 — сделать то же самое.

«Меня всегда завораживал язык поколения Альфа, потому что он настолько уникален, насколько быстро все становится и теряет актуальность», — говорит Мехта.

Среди волонтеров Generation Alpha 98 процентов понимали основное значение терминов, 96 процентов понимали контекст, в котором они использовались, и 92 процента могли обнаружить, когда они использовались для причинения вреда. Но модели ИИ распознавали вредоносное использование только примерно в 4 из 10 случаев — от 32,5 процентов для Llama 3 до 42,3 процентов для Claude. Родители и профессиональные модераторы были не лучше, обнаружив только около трети вредоносных использований.

«Я ожидал немного большего понимания, чем мы получили», — говорит Мехта. «Это были в основном просто догадки со стороны родителей».

Фразы, которые обычно использует поколение Альфа, включают некоторые, которые имеют двойной смысл в зависимости от контекста. «Пусть он готовит» может быть искренней похвалой в игровом стриме — или насмешливой усмешкой, подразумевающей, что кто-то несет чушь. «Кыс», когда-то сокращенное от «познай себя», теперь для некоторых читается как «убей себя». Другая фраза, которая может скрывать оскорбительное намерение, — «это акустическое», используемая для насмешливого вопроса, является ли кто-то аутистом.

«Поколение Альфа очень уязвимо в сети», — говорит Мехта. «Я думаю, что очень важно, чтобы LLM могли хотя бы понимать, о чем идет речь, потому что ИИ будет все больше распространяться в сфере модерации контента, и в будущем это будет происходить все чаще и чаще».

«Совершенно очевидно, что LLM меняют мир», — говорит Джунчилья. «Это действительно парадигма. Я думаю, что есть фундаментальные вопросы, которые нужно задать».

Результаты исследования были представлены на этой неделе на конференции Ассоциации вычислительной техники по вопросам справедливости, подотчетности и прозрачности в Афинах, Греция.

«Эмпирически эта работа указывает на то, что, скорее всего, будут большими недостатками в системах модерации контента для анализа и защиты молодых людей в частности», — говорит Майкл Вил из Университетского колледжа Лондона. «Компаниям и регулирующим органам, вероятно, придется уделять этому пристальное внимание и реагировать на это, чтобы оставаться выше закона в растущем числе юрисдикций с законами о платформах, направленными на защиту молодых людей».

FAccT '25: Труды конференции ACM 2025 года по вопросам справедливости, подотчетности и прозрачности DOI: 10.1145/3715275.3732184

Источник: www.newscientist.com

✅ Найденные теги: Кодированный, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых