Применяйте лучшие методы из академической среды, чтобы извлечь максимальную пользу из практического применения.
Делиться

Содержание
- Введение: Почему была создана эта статья.
- Обнаружение аномалий: краткий обзор.
- Размер изображения: стоит ли увеличивать размер входного изображения?
- Кадрирование в центре: сфокусируйтесь на объекте.
- Удаление фона: удалите все ненужное.
- Ранняя остановка: используйте набор данных для проверки.
- Заключение
1. Введение
Существует несколько методов повышения производительности, которые используются авторами в академической среде, чтобы предлагаемая модель выделялась, демонстрируя более впечатляющие результаты по сравнению с другими моделями. Например, использование большего размера входных данных, что помогает обнаруживать мелкие дефекты; другой метод — удаление части фона для уменьшения количества ложных срабатываний.
В академической среде такой подход может быть слабым, поскольку он делает сравнения между различными моделями менее справедливыми и может не показывать одинаково хороших результатов на всех наборах данных. Однако эти методы также могут быть использованы для повышения производительности в практических приложениях, если применять их осторожно. В этой статье мы рассмотрим несколько наиболее эффективных методов и объясним, как использовать их для достижения лучших результатов, избегая при этом потенциальных недостатков.
2. Обнаружение аномалий
Модели обнаружения аномалий часто называют «неконтролируемыми», но это название может вводить в заблуждение, поскольку большинству из них для обучения требуется только один класс — нормальные изображения без дефектов. Для обучения с использованием одного класса данные необходимо разметить по отдельным классам, что отличается от обычного определения неконтролируемого обучения.
На основе изображений, использованных в процессе обучения, модель учится определять, как выглядит «норма», и должна уметь распознавать отклонения от неё как изображения с дефектами. Эти дефекты часто бывают небольшими.
И его трудно заметить даже профессиональным инспекторам на производственной линии. Пример ниже показывает каплю сварочной пасты на одном из контактов, которую трудно обнаружить без эталонной маски, показывающей местоположение дефекта справа.
Для получения более подробной информации о визуальном обнаружении промышленных аномалий см. эту статью или этот опрос.

3. Размер изображения
Если изображения в вашем наборе данных содержат небольшие дефекты (менее 0,2% изображения, это число произвольно и зависит от используемой модели и других факторов), которые модель не может обнаружить, попробуйте увеличить размер входных данных. Часто это помогает обнаружить такие дефекты, сделав их достаточно большими, чтобы модель могла их увидеть.
При наличии крупных дефектов (10% изображения или более, это число также является произвольным) следует более тщательно подходить к выбору модели. Некоторые модели, такие как PatchCore, показывают лучшие результаты для дефектов разных размеров при большем размере входных данных, другие, такие как RD4AD, могут значительно ухудшить свои результаты при больших дефектах, как описано в нашей статье о сравнительном анализе, таблицы 5 и 14. Рекомендуется проверить, как выбранная модель работает на различных типах дефектов.
Еще одним важным фактором при использовании входных данных большего размера являются скорость обработки и ограничения по памяти. Как показано в
В статье MVTec AD 2 (рис. 6) показано, что время вывода и использование памяти значительно увеличились почти для всех протестированных моделей с большими размерами входных данных.
4. Центральная культура
Если у вас есть данные с объектом в центре изображения, а остальную часть можно безопасно обрезать, смело делайте это. Как показано на изображении ниже, обрезка ближе к проверяемой части помогает избежать ложных срабатываний. Важным побочным эффектом является также увеличение относительного размера проверяемой части; как описано ранее, это может помочь вам получить лучшие результаты для небольших дефектов или увеличить скорость обработки, позволяя уменьшить размер изображения.

Предупреждение: В большинстве популярных наборов данных представлен случай, когда основной объект можно безопасно обрезать по центру, как показано на рис. 2 здесь или на изображении выше. По этой причине многие оригинальные реализации современных методов включают в себя аугментацию путем обрезки по центру. Использование обрезки по центру может быть проблематичным в реальных приложениях с дефектами вблизи краев изображения; в этом случае убедитесь, что такая обрезка отключена.
5. Удаление фона
Удалите фон, чтобы еще больше уменьшить количество ложных срабатываний. Аналогично обрезке по центру, убедитесь, что аномалии или дефекты в удаленной области не влияют на качество изготовленной детали. Если в какой-либо части объекта раньше не было дефектов, не удаляйте ее, потому что дефекты могут появиться там в будущем, и вы не хотите их пропустить.

6. Ранняя остановка
Большинство моделей обнаружения аномалий используют фиксированное количество эпох, которое часто оптимизировано для популярных наборов данных. Возможно, будет полезно попробовать раннюю остановку на ваших данных, чтобы избежать переобучения или ускорить обучение за меньшее количество эпох. Ранняя остановка иногда используется неправильно, например, для остановки обучения используется производительность тестового набора, что делает сообщаемые результаты нереалистично хорошими. Однако, если применить её к отдельному набору данных для валидации, можно добиться существенного улучшения, как показано в таблице 9.
Предупреждение: Некоторые оригинальные реализации современных моделей могут использовать раннюю остановку на тестовом наборе данных или сообщать о наилучших результатах на протяжении всех эпох на основе производительности на тестовом наборе. Перед запуском проверьте код, чтобы убедиться, что модель не переобучится на тестовом наборе данных с чрезмерно оптимистичными результатами.
7. Заключение
- Увеличьте размер изображения
- ЧТО НУЖНО СДЕЛАТЬ: проверьте, способна ли выбранная модель обнаруживать дефекты разных размеров; убедитесь, что скорость вывода достаточна.
- НЕ СЛЕДУЕТ: пропускать крупные дефекты
- Центральная культура
- Необходимо убедиться, что после обрезки проверяемый объект полностью находится в кадре.
- НЕ СЛЕДУЕТ: пропускать дефекты в удаленной области.
- Удалить фон
- ВАЖНО: убедитесь, что удаляемая область не имеет отношения к проверке.
- НЕ СЛЕДУЕТ: пропускать дефекты на заднем плане.
- Ранняя остановка
- ВЫПОЛНИТЕ: используйте набор проверок
- НЕ СЛЕДУЕТ: переобучать тестовый набор
Убедитесь, что применение этих методов или их комбинации не приведет к пропуску дефектов. Некоторые из них могут иметь обратный эффект, даже если применяются к другому общедоступному набору данных. В реальных условиях это может привести к поставке дефектных деталей клиенту.
Однако при осторожном использовании они могут заметно улучшить производительность моделей обнаружения аномалий в практических приложениях, используя знания о ваших данных и дефектах.
Подпишитесь на автора в LinkedIn, чтобы узнать больше о визуальном обнаружении аномалий в промышленности.
Ссылки
- А. Байтиева, Ю. Буауни, А. Бриот, Д. Амельн, С. Хальфауи и С. Акчай. За пределами академических стандартов: критический анализ и лучшие практики визуального обнаружения промышленных аномалий (2025), Семинар CVPR по визуальному обнаружению аномалий и новизны (VAND).
- Y. Zou, J. Jeong, L. Pemula, D. Zhang и O. Dabeer, Самостоятельное предварительное обучение алгоритму «Найди отличия» для обнаружения аномалий и сегментации (2022), ECCV
- С. Акчай, Д. Амельн, А. Вайдья, Б. Лакшманан, Н. Ахуджа и У. Генч, Аномалиб (2022), ICIP
- Дж. Лю, Г. Се, Дж. Ван, С. Ли, Ч. Ван, Ф. Чжэн и Ю. Цзинь, Глубокое обнаружение аномалий в промышленных изображениях: обзор (2024), Исследования в области машинного интеллекта
- Л. Хеклер-Крам, Й. Нойдек, У. Шелер, Р. Кёниг и К. Штегер, Набор данных MVTec AD 2: Расширенные сценарии для неконтролируемого обнаружения аномалий (2025), препринт arXiv
- К. Рот, Л. Пемула, Й. Зепеда, Б. Шёлькопф, Т. Брокс, П. Гелер, К полному повторению в обнаружении промышленных аномалий (2022), CVPR
Источник: towardsdatascience.com



























