Архив рубрики ~Лента новостей~

Бюджетный Vision Transformer

Бюджетный Vision Transformer

Понимание того, как работает DeiT посредством дистилляции знаний, и как реализовать это с помощью PyTorch

Делиться

c790b013ee72c0d87000f0c817602dc8

Введение

Ванильный ViT проблематичен. Если вы посмотрите на оригинальную статью ViT [1], вы заметите, что хотя эта модель глубокого обучения доказала свою исключительную эффективность, для ее достижения требуются сотни миллионов помеченных обучающих изображений. Ну, это очень много.

Это требование огромного количества данных, безусловно, является проблемой, и поэтому нам нужно решение для этого. Туврон и др. еще в декабре 2020 года в своей исследовательской работе под названием «Обучение эффективных по данным преобразователей изображений и дистилляция через внимание» [2] выдвинули идею сделать обучение модели ViT намного более дешевым в вычислительном отношении. Авторы придумали идею, в которой вместо обучения модели на основе преобразователя с нуля они использовали знания существующей модели посредством дистилляции. С помощью этого подхода им удалось решить проблему ViT, связанную с нехваткой данных, при этом сохранив высокую точность. Что еще интереснее, эта статья вышла всего через два месяца после оригинальной ViT!

В этой статье я собираюсь обсудить модель, которую авторы назвали DeiT (Data-effective image Transformer), а также то, как реализовать архитектуру с нуля. Поскольку DeiT напрямую выведен из ViT, настоятельно рекомендуется иметь предварительные знания о ViT перед прочтением этой статьи. Вы можете найти мою предыдущую статью об этом в ссылке [3] в конце этого поста.

Источник: towardsdatascience.com

❌ Нет тегов для этой статьи
Читайте также
Архив рубрики ~Обо всем~ Аппаратное обеспечение, которое делает возможным искусственный интеллект. Архив рубрики ~Обо всем~ Специальность «Информатика» никуда не исчезла. Архив рубрики ~Обо всем~ Silent Hill Townfall переносит атмосферный хоррор в Шотландию 90-х годов с невероятным вниманием к деталям. Архив рубрики ~Обо всем~ Лучшие предложения стриминговых сервисов для студентов: Spotify, Hulu, HBO Max и другие. Архив рубрики ~Обо всем~ Предварительное заполнение один раз, распространение по сети: обмен снимками ключ-значение для многоагентных конвейеров обработки данных LLM. Архив рубрики ~Обо всем~ В Grave Seasons к уютным механикам фермерства и дружбы добавляются элементы детектива и расследования убийств. Архив рубрики ~Коротко из Telegram~ Собираем собственный ИИ-офис — инструмент Agent Teams запускает целую команду… Архив рубрики ~Коротко из Telegram~ ❗️Krea презентовали сразу несколько обновлений и это стоит разобрать ⚡️Krea… Архив рубрики ~Коротко из Telegram~ 😈 Пока индустрия обсуждает новые модели и агентные фреймворки, исследователи… Архив рубрики ~Коротко из Telegram~ Высыпаться можно будет, не засыпая: учёные научились включать в бодрствующем… Архив рубрики ~Коротко из Telegram~ За четыре дня в ИИ-рынке сошлось столько плохих новостей, что… Архив рубрики ~Коротко из Telegram~ NVIDIA тащит ИИ из облака прямо в ноутбуки На Computex… Архив рубрики ~Коротко из Telegram~ Дейтинг в 2026 всё больше похож на симулятор одиночества Пока… Архив рубрики ~Коротко из Telegram~ GPU уже не главный стоп-кран для ИИ в бизнесе Миф… Архив рубрики ~Обо всем~ Аппаратное обеспечение, которое делает возможным искусственный интеллект. Архив рубрики ~Обо всем~ Специальность «Информатика» никуда не исчезла. Архив рубрики ~Обо всем~ Silent Hill Townfall переносит атмосферный хоррор в Шотландию 90-х годов с невероятным вниманием к деталям. Архив рубрики ~Обо всем~ Лучшие предложения стриминговых сервисов для студентов: Spotify, Hulu, HBO Max и другие. Архив рубрики ~Обо всем~ Предварительное заполнение один раз, распространение по сети: обмен снимками ключ-значение для многоагентных конвейеров обработки данных LLM. Архив рубрики ~Обо всем~ В Grave Seasons к уютным механикам фермерства и дружбы добавляются элементы детектива и расследования убийств. Архив рубрики ~Коротко из Telegram~ Собираем собственный ИИ-офис — инструмент Agent Teams запускает целую команду… Архив рубрики ~Коротко из Telegram~ ❗️Krea презентовали сразу несколько обновлений и это стоит разобрать ⚡️Krea… Архив рубрики ~Коротко из Telegram~ 😈 Пока индустрия обсуждает новые модели и агентные фреймворки, исследователи… Архив рубрики ~Коротко из Telegram~ Высыпаться можно будет, не засыпая: учёные научились включать в бодрствующем… Архив рубрики ~Коротко из Telegram~ За четыре дня в ИИ-рынке сошлось столько плохих новостей, что… Архив рубрики ~Коротко из Telegram~ NVIDIA тащит ИИ из облака прямо в ноутбуки На Computex… Архив рубрики ~Коротко из Telegram~ Дейтинг в 2026 всё больше похож на симулятор одиночества Пока… Архив рубрики ~Коротко из Telegram~ GPU уже не главный стоп-кран для ИИ в бизнесе Миф…

Подписка на рассылку

Получайте свежие новости и идеи на почту. Без спама — только самое интересное.

Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.