Использование ИИ для автоматизации распознавания типов транспортных средств
Актуальность проблемы
Обзор существующих моделей
Описание и источники данных
Архитектура модели нейронной сети
Процесс обучения и настройки
Моделирование результатов обучения и их интерпретация
Моделирование результатов обучения и их интерпретация
Тестирование модели на реальных данных
Результаты работы модели
Результаты работы модели
Результаты работы модели
Заключение
2.11M

курсач

1. Использование ИИ для автоматизации распознавания типов транспортных средств

Выполнили:
студенты группы ИДБ22-10
Харсиев Р.А.
Тинамагомедов Р.А.

2. Актуальность проблемы

С каждым годом количество транспортных средств
в городах увеличивается, и ручные методы учёта
уже не справляются с оценкой потока машин в
режиме реального времени. Автоматическое
распознавание типа транспортного средства важно
для управления трафиком, систем
видеонаблюдения, контроля доступа и статистики.
Наша цель – разработать систему, которая сможет
точно и быстро классифицировать изображение
автомобиля, мотоцикла, поезда или другого вида
транспорта без участия человека.

3. Обзор существующих моделей

Существует несколько популярных подходов к
классификации изображений:
VGG (16/19) – Глубокая структура, высокая
точность, однако высокие вычислительные
требования
ResNet (50/101) – Residual-блоки,
устойчивость к глубокому обучению, но
требовательна к объему обучающих данных
MobileNet/EfficientNet – Оптимизированы
для встроенных систем, однако сложная
реализация с нуля

4. Описание и источники данных

Сведения о наборе данных: В проекте используется
набор данных Vehicle-10, который включает в себя:
Количество классов: 10 различных типов
транспортных средств (мы изменили датасет,
поэтому классов 8).
Примеры для каждого класса:
Сбалансированное количество изображений
для каждого класса.
Схема секционирования: 70% обучение, 15%
проверка, 15% тестирование.
На этапе загрузки мы применяем
аугментации.

5. Архитектура модели нейронной сети

Модель имеет 9 обучаемых слоёв (6 свёрточных + 2
свёрточных в residual + 1 полносвязный), и два
residual-блока облегчают прохождение градиента,
что ускоряет и стабилизирует обучение.
Из-за небольшой глубины сеть обучается довольно
быстро, даже на CPU (GPU ускоряет процесс), и при
этом достаточно точно выделяет особенности
транспортных средств.

6. Процесс обучения и настройки

1) Loss-функция:
– CrossEntropyLoss с весами для компенсации дисбаланса классов: weight = 1 / (количество примеров
в данном классе)
2) Оптимизатор:
– Adam с начальным learning rate = 1·10⁻³
3) Scheduler:
– ReduceLROnPlateau(mode='min', factor=0.5, patience=3)
4) Параметры обучения:
– batch_size = 128
– num_epochs = 50
– WeightedRandomSampler в train_loader для балансировки выборки

7. Моделирование результатов обучения и их интерпретация

8. Моделирование результатов обучения и их интерпретация

9. Тестирование модели на реальных данных

Для упрощения демонстрации мы реализовали
функцию predict_image(path), которая:
Загружает изображение из заданного пути,
конвертирует его в RGB и отображает на
экране.
Применяет к нему те же трансформации, что и
к validation-данным (resize 32×32, toTensor,
normalize).
Выполняет прямой проход (forward) через
обученную ResNet9.
Вычисляет softmax по выходным логитам и
определяет класс с максимальной
вероятностью.
Выводит предсказанный класс и саму
вероятность (например, Predicted: bus
(p=0.87)).

10. Результаты работы модели

11. Результаты работы модели

12. Результаты работы модели

13. Заключение

Таким образом, мы продемонстрировали, что с
помощью относительно маленькой и быстрой сети
ResNet9 можно получить рабочую систему
автоматического распознавания типов
транспортных средств. Полученные результаты
показывают, что даже при невозможности
полноценно использовать тяжёлые архитектуры
можно добиться приемлемой точности и
устойчивости к вариативному фону и освещению.
При дальнейшем расширении датасета и доработке
аугментаций модель готова стать частью реальной
системы видеомониторинга и аналитики.
English     Русский Правила