Выпускная квалификационная работа на тему: ” Анализ и прогнозирование стоимости авиа-перелёта с помощью технологий обработки
Актуальность
Используемые технологии
Математическая постановка задачи
Цель и задачи
Используемые данные
Предобработка данных
Предобработка данных
Скоррелированность и важность признанов
Используем линейную модель с l1 регулярищацией
Обучение модели
Результат работы нейросети
Метрики
Практическая значимость
Выводы
Спасибо за внимание

Анализ и прогнозирование стоимости авиа-перелёта с помощью технологий обработки больших данных

1. Выпускная квалификационная работа на тему: ” Анализ и прогнозирование стоимости авиа-перелёта с помощью технологий обработки

больших данных ”
Выполнил студент группы 211-364: Бовкунов Даниил Андреевич
Научный руководитель: Старший преподаватель, Максим Вячеславович
Шульга

2. Актуальность

• Оптимизация расходов на путешествия
• Рост пассажиропотока
• Конкуренция на рынке
• Data-Driven ценообразование
2

3. Используемые технологии

• Python
• Pandas, NumPy
• Matplotlib
• Dask – обработка больших датасетов, не
помещающихся в оперативную память.
• Colab/Jupyter Notebook
3

4. Математическая постановка задачи


4

5. Цель и задачи

Цель исследования: разработка модели машинного
обучения для прогнозирования стоимости авиабилетов
на основе анализа факторов ценообразования, включая
динамику спроса, сезонность и параметры перелёта
Задачи:
• Изучить датасет со ценами на авиа-перелёты
• Сбор, подготовка, обработка и анализ данных
• Построить, обучить и протестировать построенные
модели
• Оценить качество с использованием метрик
5

6. Используемые данные

• Flight Price Prediction Dataset, business and economy
6

7. Предобработка данных

• Заполнение пропусков
• удаления избыточных столбцов, разделения на
числовые и категориальные признаки, обработки
выбросов методом Winsorizer
• Обработка категориальных переменных и выбросов
7

8. Предобработка данных

8

9. Скоррелированность и важность признанов

9

10. Используем линейную модель с l1 регулярищацией

10

11. Обучение модели

11

12. Результат работы нейросети

12

13. Метрики

• MAE
• RMSE
• R²
• MAPE
13

14. Практическая значимость

• в системы динамического ценообразования
авиакомпаний
• в агрегаторы билетов OzonTravel, Aviasales для
оптимизации рекомендаций
• Для предсказаний минимально и максимальной
стоимости авиаперелёта
14

15. Выводы

• – доказано, что применение Big Data и ML позволяет
прогнозировать стоимость авиабилетов с точностью R²
> 0.96;
– показана эффективность Random
Forest и XGBoost для анализа динамики цен с учётом
сезонности и спроса;
– предложены решения для внедрения модели в
системы авиакомпаний и агрегаторов, что повысит
доходность и прозрачность ценообразования.
15

16. Спасибо за внимание

Тема: ”Анализ и прогнозирование стоимости авиа-перелёта с
помощью технологий обработки больших данных ”
Студент: Бовкунов Даниил Андреевич
Группа: 211-364
Руководитель работы: Старший преподаватель, Максим
Вячеславович Шульга
English     Русский Правила