Можно ли интегрировать с WordPress?

Да, мы используем REST API и Application Passwords — без передачи логина и пароля. Все публикации идут от имени автора.

Работает ли ИИ с Telegram?

Полностью. ИИ может как читать каналы, так и публиковать в ваш канал. Также подключаем inline-ботов и формы сбора лидов.

Сколько времени занимает настройка?

От 3 до 7 дней. Зависит от сложности интеграции и количества источников.

Есть ли бесплатный демо-доступ?

Да, мы запускаем 5–7 дневный демо-доступ с тестовыми данными, чтобы вы увидели систему в работе.

Безопасна ли система?

Да. Все данные хранятся изолированно. Мы не используем их для обучения моделей. Поддерживаем шифрование и резервное копирование.

Что входит в поддержку?

Обновление агентов, добавление источников, исправление ошибок, масштабирование. Поддержка 24/7 по Telegram или email.

Новый проект делает данные Википедии более доступными для ИИ

Окт 1, 2025 0

На сенсорной панели открытого MacBook находится логотип Wikipedia, напечатанный на 3D-принтере. — **Источники изображений:** Wikimedia Commons (открывается в новом окне)

В среду Wikimedia Deutschland анонсировала новую базу данных, которая сделает богатство знаний Википедии более доступным для моделей искусственного интеллекта.

Система, получившая название Wikidata Embedding Project, применяет векторный семантический поиск — метод, который помогает компьютерам понимать значение и взаимосвязи между словами — к существующим данным в Wikipedia и родственных ей платформах, состоящим из почти 120 миллионов записей.

В сочетании с новой поддержкой протокола контекста модели (MCP), стандарта, который помогает системам ИИ взаимодействовать с источниками данных, проект делает данные более доступными для запросов на естественном языке от LLM.

Проект был реализован немецким филиалом Wikimedia в сотрудничестве с компанией нейронного поиска Jina.AI и компанией DataStax, предоставляющей данные для обучения в режиме реального времени и принадлежащей IBM.

Wikidata уже много лет предоставляет машиночитаемые данные из ресурсов Wikimedia, но существующие инструменты позволяют выполнять только поиск по ключевым словам и запросы на SPARQL, специализированном языке запросов. Новая система будет лучше работать с системами генерации дополненной поисковой информации (RAG), которые позволяют моделям ИИ получать доступ к внешней информации, предоставляя разработчикам возможность основывать свои модели на знаниях, проверенных редакторами Wikipedia.

Данные также структурированы для обеспечения важного семантического контекста. Например, запрос к базе данных по слову «ученый» выдаст списки выдающихся учёных-атомщиков, а также учёных, работавших в Bell Labs. Также доступны переводы слова «ученый» на разные языки, изображение учёных за работой, одобренное Викимедиа, и экстраполяции на связанные понятия, такие как «исследователь» и «ученый».

База данных доступна публично на Toolforge. Wikidata также проведёт вебинар для заинтересованных разработчиков 9 октября.

Новый проект появился в то время, когда разработчики искусственного интеллекта (ИИ) отчаянно ищут высококачественные источники данных для тонкой настройки моделей. Сами системы обучения стали сложнее — зачастую они представляют собой сложные обучающие среды, а не простые наборы данных, — но для их эффективной работы по-прежнему требуются тщательно отобранные данные. Для развёртываний, требующих высокой точности, потребность в надёжных данных особенно острая. И хотя некоторые могут с пренебрежением относиться к Википедии, её данные значительно более фактологичны, чем универсальные наборы данных, такие как Common Crawl, представляющие собой огромную коллекцию веб-страниц, собранных со всего интернета.

В некоторых случаях стремление к получению высококачественных данных может иметь дорогостоящие последствия для лабораторий ИИ. В августе компания Anthropic предложила урегулировать судебный процесс с группой авторов, чьи работы использовались в качестве учебных материалов, согласившись выплатить 1,5 миллиарда долларов, чтобы положить конец любым обвинениям в неправомерных действиях.

В заявлении для прессы руководитель проекта Wikidata AI Филипп Сааде подчеркнул независимость своего проекта от крупных лабораторий искусственного интеллекта или крупных технологических компаний. «Запуск проекта Embedding Project показывает, что мощный ИИ не обязательно должен контролироваться горсткой компаний», — заявил Сааде журналистам. «Он может быть открытым, коллективным и построенным на служении всем».

Источник: techcrunch.com

✅ Найденные теги: новости, Новый

Метки:

новости Новый

ПРЕДЫДУЩАЯ ЗАПИСЬ

01.10.2025

Агентство по охране окружающей среды прекращает сбор данных о выбросах парниковых газов. Кто восполнит этот пробел?

СЛЕДУЮЩАЯ ЗАПИСЬ

01.10.2025

Ограничение контекстного окна GPT-5 и его эффективное использование в Bothub

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

Человек играет на скрипке на улице перед кирпичной стеной.

Протест против дата-центров, плакаты: "Вы не можете пить данные", "Вода — это жизнь".

Силуэт лица с диаграммой связи на голове, символизирующий думы и идеи.

Руки режут свежий хлеб на деревянной доске.

Женщина с красными волосами смотрит через металлическую сферу на фоне кирпичной стены.

Мужчина заряжает электромобиль на зимней стоянке, снег, дальний план - деревья и горы.

Человек спит в кровати под красным пледом, солнечный свет падает на подушку.

НОВОСТИ ДРУГИХ РУБРИК

Архив рубрики ~Лента новостей~

Спрос на хранилища для ИИ привёл к 24% росту прибыли производителей памяти NAND

Умные люди из аналитического агентства TrendForce провели анализ текущей ситуации производителей микросхем памяти NAND и пришли к выводу, что за последний квартал 2025 года их выручка прилично увеличилась, а показатели некоторых компаний прилично выделяются на фоне остальных.…

ЧИТАТЬ

Мар 5, 2026

Архив рубрики ~Лента новостей~

Bitget Wallet интегрирует DT One для пополнения мобильной связи в более чем 170 странах

Bitget Wallet, приложение для повседневных финансов, объявил о партнерстве с DT One, которое позволит осуществлять пополнение мобильной связи напрямую внутри кошелька с использованием стейблкоинов, связывая ончейн-балансы с повседневными телеком-сервисами. Благодаря инфраструктуре DT One пользователи Bitget Wallet получают…

ЧИТАТЬ

Мар 5, 2026

Человек в смокинге держит планеты Земля и Марс, символизируя космические достижения.

Архив рубрики ~Лента новостей~

Почему SpaceX может выйти на биржу и с чем это может быть связано

Мы ведь явно не воспринимаем всерьез центры обработки данных в космосе? Элизабет Лопатто, старший репортер. Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего сайта. Все…

ЧИТАТЬ

Мар 5, 2026

Твердотельный аккумулятор Donut на выставке, показывает замещающий литий-ион стоимость.

Архив рубрики ~Лента новостей~

Согласно результатам испытаний, твердотельная батарея Donut Lab способна выдерживать (экстремальные) температуры.

Разработанная финским стартапом батарея не только выдержала экстремальные условия высокой температуры, но и фактически увеличила свою емкость. Эндрю Дж. Хокинс, редактор раздела «Транспорт». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в…

ЧИТАТЬ

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO

Новый проект делает данные Википедии более доступными для ИИ

Похожие записи

Еще новости рубрики

Присоединяйтесь к нам в

Рубрики

галерея

НОВОСТИ ДРУГИХ РУБРИК

Присоединяйтесь
к нам в