Image

10 данных + наблюдения ИИ на осень 2025 года

Что происходит и что ждет нас в сфере данных и искусственного интеллекта к концу 2025 года.

Делиться

5a3780e9ab04f1e1e306159196a0da1f

Поскольку мы приближаемся к последнему кварталу 2025 года, самое время сделать шаг назад и проанализировать тенденции, которые будут определять данные и ИИ в 2026 году.

Хотя заголовки новостей, возможно, и сосредоточены на последних моделях и войнах бенчмарков, они далеко не самые революционные разработки на местах. Настоящие перемены происходят на передовой — там, где специалисты по данным, инженеры по данным и ИИ, а также команды ИИ/МО внедряют эти сложные системы и технологии в производство. И неудивительно, что стремление к промышленному ИИ и связанные с ним трудности в 2025 году — это движущая сила.

Вот десять тенденций, определяющих эту эволюцию, и что они будут означать в последнем квартале 2025 года.

1. «Лидеры данных и искусственного интеллекта» на подъеме

Если вы в последнее время заходили на LinkedIn, вы могли заметить подозрительный рост количества заголовков, связанных с данными и ИИ, в вашей ленте новостей — даже среди членов вашей собственной команды.

Нет, не было ни одной реструктуризации, о которой вы бы не знали.

Хотя это в значительной степени добровольное изменение среди тех, кого традиционно относят к категории специалистов по данным или ИИ/МО, такое изменение названий отражает реальность, которую Монте-Карло обсуждает уже почти год: данные и ИИ больше не являются двумя отдельными дисциплинами.

Данные и ИИ — это две стороны одной медали: от необходимых ресурсов и навыков до решаемых задач. И эта реальность оказывает заметное влияние на развитие как команд, так и технологий в 2025 году (как вы скоро увидите).

2. Разговорный BI — это круто, но ему нужна проверка температуры

Демократизация данных в той или иной форме наблюдается уже почти десять лет, и разговорный бизнес-анализ — это последняя глава в этой истории.

Разница между разговорным BI и любым другим BI-инструментом заключается в скорости и элегантности, с которой он обещает воплотить в жизнь это утопическое видение — даже для самых неподготовленных в технической области пользователей.

Идея проста: если вы можете запросить что-то, вы можете получить к этому доступ. Это выгодно как владельцам, так и пользователям… в теории. Проблема (как и в любых усилиях по демократизации) заключается не в самом инструменте, а в надёжности того, что вы демократизируете.

Хуже плохих идей может быть только плохая информация, полученная на скорую руку. Подключите чат-интерфейс к неуправляемой базе данных, и вы не просто ускорите доступ — вы ускорите последствия.

3. Контекстная инженерия становится ключевой дисциплиной

Входные затраты на модели ИИ примерно в 300–400 раз превышают выходные. Если ваши контекстные данные осложнены такими проблемами, как неполные метаданные, необработанный HTML или пустые векторные массивы, ваша команда столкнется с огромным перерасходом средств при масштабной обработке. Более того, запутанный или неполный контекст также является серьёзной проблемой надёжности ИИ: неоднозначные названия продуктов и неудачное разделение данных на фрагменты сбивают с толку ретриверы, а небольшие изменения в подсказках или моделях могут привести к существенно различающимся результатам.

Неудивительно, что в середине 2025 года контекстная инженерия стала самым модным словом для команд, работающих с данными и ИИ. Контекстная инженерия — это систематический процесс подготовки, оптимизации и поддержки контекстных данных для моделей ИИ. Команды, освоившие первоначальный мониторинг контекста — обеспечивающие надёжный корпус данных и встроенные данные до начала дорогостоящей обработки, — получат гораздо лучшие результаты от своих моделей ИИ. Но изолированно это не сработает.

Реальность такова, что прозрачность контекстных данных сама по себе не может обеспечить качество ИИ, как и решения для обеспечения прозрачности ИИ, такие как оценки. Командам необходим комплексный подход, обеспечивающий прозрачность всей системы в процессе производства — от контекстных данных до модели и её результатов. Социотехнический подход, объединяющий данные и ИИ, — единственный путь к надёжному масштабируемому ИИ.

4. Разрыв в энтузиазме по поводу ИИ увеличивается

Последний отчёт Массачусетского технологического института (MIT) сказал всё. У ИИ есть проблема с ценностями. И вина за это, по крайней мере отчасти, лежит на руководстве.

«У нас по-прежнему много людей, которые верят, что ИИ — это магия, которая сделает все, что вы захотите, не задумываясь».

Это реальная цитата, и она перекликается с общей историей для команд, работающих с данными и искусственным интеллектом.

  • Руководитель, который не понимает технологию, устанавливает приоритеты
  • Проект не обеспечивает ценности
  • Пилот отправлен на слом
  • Промыть и повторить

Компании тратят миллиарды на пилотов ИИ, не имея четкого представления о том, где и как ИИ окажет влияние, — а ведь это оказывает очевидное влияние не только на эффективность пилотов, но и на энтузиазм по поводу ИИ в целом.

Получение ценности должно быть первым, вторым и третьим приоритетами. Это означает предоставление командам, работающим с данными и ИИ, которые понимают как технологию, так и данные, лежащие в её основе, автономии для решения реальных бизнес-задач, а также ресурсов для обеспечения надёжности этих сценариев использования.

5. Взлом кода агентов против агентских рабочих процессов

В то время как на протяжении последних 18 месяцев ажиотаж вокруг агентов только усиливался, семантические дебаты между «агентским ИИ» и «агентами» этим летом наконец-то состоялись на священной земле раздела комментариев LinkedIn.

В основе проблемы лежит существенная разница между эффективностью и стоимостью этих двух, казалось бы, идентичных, но на удивление различающихся тактик.

  • Специализированные агенты — это надежные помощники для решения конкретных, четко определенных задач с понятным объемом задач и предсказуемыми результатами. Используйте их для целенаправленной, повторяющейся работы.
  • Агентные рабочие процессы справляются со сложными, многоэтапными процессами, разбивая их на управляемые компоненты. Секрет в том, чтобы разбить крупные проблемы на отдельные задачи, которые могут выполнять модели меньшего размера, а затем использовать более крупные модели для проверки и агрегации результатов.
039a98f13c363a8a34ce6d59adde5366

Например, агент устранения неполадок Monte Carlo использует агентный рабочий процесс для организации сотен субагентов с целью расследования коренных причин проблем с качеством данных и ИИ.

6. Качество встраивания находится в центре внимания, а мониторинг — сразу за ним

В отличие от прежних продуктов обработки данных, ИИ в его различных формах не является детерминированным по своей природе. Что входит, то и получается не всегда. Поэтому, чтобы прояснить, что такое «хорошо» в данном контексте, необходимо измерять не только результаты, но и системы, код и входные данные, которые их обеспечивают.

Встраивание является одной из таких систем.

Если встраивание не отражает семантическое значение исходных данных, ИИ получит неверный контекст независимо от векторной базы данных или производительности модели. Именно поэтому качество встраивания становится критически важным приоритетом в 2025 году.

Наиболее частыми сбоями внедрения являются базовые проблемы с данными: пустые массивы, неправильная размерность, поврежденные векторные значения и т. д. Проблема в том, что большинство команд обнаруживают эти проблемы только тогда, когда ответ явно неточен.

Один из клиентов Монте-Карло прекрасно сформулировал проблему: «У нас нет никакого понимания того, как генерируются вложения, что это за новые данные и как они влияют на процесс обучения. Мы боимся менять модели вложения, потому что не знаем, как переобучение повлияет на них. Нужно ли нам переобучать модели, использующие это? Нужно ли начинать всё сначала?»

Поскольку ключевые параметры качества и производительности выходят на первый план, команды начинают определять новые стратегии мониторинга, которые могут поддерживать внедрение в производство, включая такие факторы, как размерность, согласованность и полнота вектора, среди прочих.

7. Векторные базы данных нуждаются в проверке на практике

Векторные базы данных — не новинка 2025 года. Новшеством является то, что команды, работающие с данными и ИИ, начинают понимать, что векторные базы данных, на которые они полагались, могут оказаться не такими надежными, как они думали.

За последние 24 месяца векторные базы данных (которые хранят данные в виде многомерных векторов, фиксирующих семантическое значение) стали фактической инфраструктурой для приложений RAG. А в последние месяцы они также стали источником беспокойства для команд, работающих с данными и искусственным интеллектом.  

Встраивания дрейфуют. Стратегии фрагментации меняются. Модели встраивания обновляются. Все эти изменения приводят к незаметному снижению производительности, которое часто ошибочно принимают за галлюцинации, и заставляют команды тратить огромные средства на их решение.

Проблема заключается в том, что, в отличие от традиционных баз данных со встроенным мониторингом, большинству команд не хватает необходимой прозрачности поиска векторов, встраивания и поведения агентов, чтобы выявлять проблемы с векторами до их возникновения. Это, вероятно, приведёт к росту внедрения мониторинга векторных баз данных, а также других решений для наблюдения, повышающих точность реагирования.

8. Ведущие архитектуры моделей отдают приоритет простоте, а не производительности.

Рынок хостинга моделей ИИ консолидируется вокруг двух явных лидеров: Databricks и AWS Bedrock. Обе платформы добиваются успеха, встраивая возможности ИИ непосредственно в существующую инфраструктуру данных, а не требуя от команд изучения совершенно новых систем.

Databricks выигрывает за счёт тесной интеграции обучения моделей, их развертывания и обработки данных. Команды могут настраивать модели на той же платформе, где хранятся их данные, устраняя сложность перемещения данных между системами. В то же время, AWS Bedrock добивается успеха благодаря широте охвата и безопасности корпоративного уровня, предлагая доступ к различным базовым моделям от Anthropic, Meta и других, при этом строго соблюдая стандарты управления данными и соответствия требованиям.

Что мешает другим? Фрагментация и сложность. Платформы, требующие обширной индивидуальной интеграции или вынуждающие команды внедрять совершенно новые наборы инструментов, проигрывают решениям, которые вписываются в существующие рабочие процессы.

Команды выбирают платформы ИИ, исходя из простоты эксплуатации и возможностей интеграции данных, а не из чистой производительности модели. Победители понимают, что даже самая лучшая модель бесполезна, если её слишком сложно развернуть и обеспечить надёжную поддержку.

9. Протокол контекста модели (MCP) — это MVP

Протокол контекста модели (MCP) стал революционным «USB-C для ИИ» — универсальным стандартом, который позволяет приложениям ИИ подключаться к любому источнику данных без специальных интеграций.

Вместо создания отдельных коннекторов для каждой базы данных, CRM или API, команды могут использовать один протокол, чтобы предоставить магистрам права доступа ко всем данным одновременно. А когда модели могут беспрепятственно извлекать данные из нескольких источников, они дают более быстрые и точные результаты.

Первые пользователи уже сообщают о значительном снижении сложности интеграции и объема работ по обслуживанию за счет сосредоточения внимания на единой реализации MCP, которая работает во всей экосистеме данных.

В качестве бонуса MCP также стандартизирует управление и ведение журнала — требования, которые важны для корпоративного развертывания.

Но не стоит ожидать, что MCP останется неизменным. Многие руководители в области данных и искусственного интеллекта ожидают появления протокола контекста агента (ACP) в течение следующего года, который будет обрабатывать ещё более сложные сценарии обмена контекстом. Команды, внедряющие MCP сейчас, будут готовы к этим достижениям по мере развития стандарта.

10. Неструктурированные данные — это новое золото (но является ли оно золотом дураков?)

Большинство приложений ИИ используют неструктурированные данные — такие как электронные письма, документы, изображения, аудиофайлы и запросы в службу поддержки — для предоставления содержательного контекста, который делает ответы ИИ полезными.

Но хотя команды могут отслеживать структурированные данные с помощью уже существующих инструментов, неструктурированные данные долгое время оставались в «слепой зоне». Традиционные методы мониторинга качества данных не позволяют обрабатывать текстовые файлы, изображения или документы так же, как таблицы баз данных.

Такие решения, как мониторинг неструктурированных данных Monte Carlo, устраняют этот пробел для пользователей, обеспечивая автоматизированные проверки качества текстовых и графических полей в Snowflake, Databricks и BigQuery.

В перспективе мониторинг неструктурированных данных станет такой же стандартной процедурой, как и традиционные проверки качества данных. Организации будут внедрять комплексные системы качества, которые будут рассматривать все данные — как структурированные, так и неструктурированные — как критически важные активы, требующие активного мониторинга и управления.

1062ec990e1968f6e733d851637b803f

С нетерпением ждем 2026 года

Если 2025 год нас чему-то и научил, так это тому, что в сфере ИИ побеждают не те команды, у которых самый большой бюджет или самые яркие демонстрации. В гонке за ИИ побеждают те команды, которые нашли способ обеспечить надёжный, масштабируемый и заслуживающий доверия ИИ в продакшене.

Победители рождаются не в условиях тестирования, а в руках реальных пользователей. Разрабатывайте адаптируемые решения на основе ИИ, и вы добьётесь очевидной ценности ИИ. Всё очень просто.

Источник: towardsdatascience.com

✅ Найденные теги: 10, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых