Похожие презентации:
курсач
1. Использование ИИ для автоматизации распознавания типов транспортных средств
Выполнили:студенты группы ИДБ22-10
Харсиев Р.А.
Тинамагомедов Р.А.
2. Актуальность проблемы
С каждым годом количество транспортных средствв городах увеличивается, и ручные методы учёта
уже не справляются с оценкой потока машин в
режиме реального времени. Автоматическое
распознавание типа транспортного средства важно
для управления трафиком, систем
видеонаблюдения, контроля доступа и статистики.
Наша цель – разработать систему, которая сможет
точно и быстро классифицировать изображение
автомобиля, мотоцикла, поезда или другого вида
транспорта без участия человека.
3. Обзор существующих моделей
Существует несколько популярных подходов кклассификации изображений:
VGG (16/19) – Глубокая структура, высокая
точность, однако высокие вычислительные
требования
ResNet (50/101) – Residual-блоки,
устойчивость к глубокому обучению, но
требовательна к объему обучающих данных
MobileNet/EfficientNet – Оптимизированы
для встроенных систем, однако сложная
реализация с нуля
4. Описание и источники данных
Сведения о наборе данных: В проекте используетсянабор данных Vehicle-10, который включает в себя:
Количество классов: 10 различных типов
транспортных средств (мы изменили датасет,
поэтому классов 8).
Примеры для каждого класса:
Сбалансированное количество изображений
для каждого класса.
Схема секционирования: 70% обучение, 15%
проверка, 15% тестирование.
На этапе загрузки мы применяем
аугментации.
5. Архитектура модели нейронной сети
Модель имеет 9 обучаемых слоёв (6 свёрточных + 2свёрточных в residual + 1 полносвязный), и два
residual-блока облегчают прохождение градиента,
что ускоряет и стабилизирует обучение.
Из-за небольшой глубины сеть обучается довольно
быстро, даже на CPU (GPU ускоряет процесс), и при
этом достаточно точно выделяет особенности
транспортных средств.
6. Процесс обучения и настройки
1) Loss-функция:– CrossEntropyLoss с весами для компенсации дисбаланса классов: weight = 1 / (количество примеров
в данном классе)
2) Оптимизатор:
– Adam с начальным learning rate = 1·10⁻³
3) Scheduler:
– ReduceLROnPlateau(mode='min', factor=0.5, patience=3)
4) Параметры обучения:
– batch_size = 128
– num_epochs = 50
– WeightedRandomSampler в train_loader для балансировки выборки
7. Моделирование результатов обучения и их интерпретация
8. Моделирование результатов обучения и их интерпретация
9. Тестирование модели на реальных данных
Для упрощения демонстрации мы реализовалифункцию predict_image(path), которая:
Загружает изображение из заданного пути,
конвертирует его в RGB и отображает на
экране.
Применяет к нему те же трансформации, что и
к validation-данным (resize 32×32, toTensor,
normalize).
Выполняет прямой проход (forward) через
обученную ResNet9.
Вычисляет softmax по выходным логитам и
определяет класс с максимальной
вероятностью.
Выводит предсказанный класс и саму
вероятность (например, Predicted: bus
(p=0.87)).
10. Результаты работы модели
11. Результаты работы модели
12. Результаты работы модели
13. Заключение
Таким образом, мы продемонстрировали, что спомощью относительно маленькой и быстрой сети
ResNet9 можно получить рабочую систему
автоматического распознавания типов
транспортных средств. Полученные результаты
показывают, что даже при невозможности
полноценно использовать тяжёлые архитектуры
можно добиться приемлемой точности и
устойчивости к вариативному фону и освещению.
При дальнейшем расширении датасета и доработке
аугментаций модель готова стать частью реальной
системы видеомониторинга и аналитики.