Похожие презентации:
Анализ и прогнозирование стоимости авиа-перелёта с помощью технологий обработки больших данных
1. Выпускная квалификационная работа на тему: ” Анализ и прогнозирование стоимости авиа-перелёта с помощью технологий обработки
больших данных ”Выполнил студент группы 211-364: Бовкунов Даниил Андреевич
Научный руководитель: Старший преподаватель, Максим Вячеславович
Шульга
2. Актуальность
• Оптимизация расходов на путешествия• Рост пассажиропотока
• Конкуренция на рынке
• Data-Driven ценообразование
2
3. Используемые технологии
• Python• Pandas, NumPy
• Matplotlib
• Dask – обработка больших датасетов, не
помещающихся в оперативную память.
• Colab/Jupyter Notebook
3
4. Математическая постановка задачи
4
5. Цель и задачи
Цель исследования: разработка модели машинногообучения для прогнозирования стоимости авиабилетов
на основе анализа факторов ценообразования, включая
динамику спроса, сезонность и параметры перелёта
Задачи:
• Изучить датасет со ценами на авиа-перелёты
• Сбор, подготовка, обработка и анализ данных
• Построить, обучить и протестировать построенные
модели
• Оценить качество с использованием метрик
5
6. Используемые данные
• Flight Price Prediction Dataset, business and economy6
7. Предобработка данных
• Заполнение пропусков• удаления избыточных столбцов, разделения на
числовые и категориальные признаки, обработки
выбросов методом Winsorizer
• Обработка категориальных переменных и выбросов
7
8. Предобработка данных
89. Скоррелированность и важность признанов
910. Используем линейную модель с l1 регулярищацией
1011. Обучение модели
1112. Результат работы нейросети
1213. Метрики
• MAE• RMSE
• R²
• MAPE
13
14. Практическая значимость
• в системы динамического ценообразованияавиакомпаний
• в агрегаторы билетов OzonTravel, Aviasales для
оптимизации рекомендаций
• Для предсказаний минимально и максимальной
стоимости авиаперелёта
14
15. Выводы
• – доказано, что применение Big Data и ML позволяетпрогнозировать стоимость авиабилетов с точностью R²
> 0.96;
– показана эффективность Random
Forest и XGBoost для анализа динамики цен с учётом
сезонности и спроса;
– предложены решения для внедрения модели в
системы авиакомпаний и агрегаторов, что повысит
доходность и прозрачность ценообразования.
15
16. Спасибо за внимание
Тема: ”Анализ и прогнозирование стоимости авиа-перелёта спомощью технологий обработки больших данных ”
Студент: Бовкунов Даниил Андреевич
Группа: 211-364
Руководитель работы: Старший преподаватель, Максим
Вячеславович Шульга
Экономика
Программирование