Реализация на PyTorch для архитектуры YOLOv3, выполненная с нуля.
Делиться

YOLOv2, который когда-то считался передовым алгоритмом обнаружения объектов, казался устаревшим из-за появления других методов, таких как SSD (Single Shot Multibox Detector), DSSD (Deconvolutional Single Shot Detector) и RetinaNet. Наконец, спустя два года после появления YOLOv2, авторы решили улучшить алгоритм, и в итоге создали следующую версию YOLO, описанную в статье под названием «YOLOv3: Постепенное улучшение» [1]. Как следует из названия, авторы не сильно улучшили YOLOv2 с точки зрения базового алгоритма. Но, что немало, с точки зрения производительности он выглядит довольно впечатляюще.
В этой статье я расскажу о модификациях, внесенных авторами в YOLOv2 для создания YOLOv3, и о том, как реализовать архитектуру модели с нуля с помощью PyTorch. Я настоятельно рекомендую вам прочитать мою предыдущую статью о YOLOv1 [2, 3] и YOLOv2 [4] перед этой, если у вас еще нет прочной основы в понимании работы этих двух более ранних версий YOLO.
Источник: towardsdatascience.com




















