💯 Разработчик Shittu Olumide показал, как создать мультимодальное AI-приложение, которое…
💯 Разработчик Shittu Olumide показал, как создать мультимодальное AI-приложение, которое работает полностью на устройстве пользователя — без серверов, API-ключей и отправки данных в облако. В основе проекта лежит библиотека Transformers.js, позволяющая запускать современные модели прямо в браузере.
В демонстрации объединены сразу три задачи: распознавание объектов на изображениях, генерация описаний к фотографиям и преобразование речи в текст с помощью модели Whisper. Все модели загружаются локально и после первого запуска могут работать даже без подключения к интернету.
🔥 Фактически браузер начинает выполнять задачи, которые ещё недавно требовали облачной инфраструктуры и мощных серверов. Это открывает новые возможности для приложений, где важны скорость работы, конфиденциальность данных и независимость от внешних API.
Похожие записи
Оцените материал:
Похожие записи
Робот Unitree G1 выстрелил в человека — блогер обошёл защиту…
04.12.2025
Сжимаем даже огромные видео БЕЗ ПОТЕРИ КАЧЕСТВА на раз-два —…
14.06.2025
AGI через текст: OpenAI делает ставку, отказываясь от «моделей мира»…
05.04.2026Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
