Введение в Data Science

1.

Введение
в Data
Science
Цель курса
Программа
Финальный проект

2.

Цель курса
Помочь сделать
первый шаг в
Data Science

3.

С чего мы начинали
95%
99%
учениц не имели опыта в Data Science,
в том числе и в других сопряженных
областях: программирование,
статистика, аналитика и др.
учениц не работали в
областях, связанных с
аналитикой.
У нас было 3 месяца, чтобы обучить участниц
знаниям и навыкам, необходимым для
реализации первых собственных проектов

4.

Программа
01
Язык программирования Python
(basic Python syntax, pandas, numpy)
02
Визуализация данных
(matplotlib, seaborn)
03
Основные статистические индикаторы
(mean, median, mode, std…)
04
Разведочный
анализ данных
05
Машинное обучение
(scikit-learn)
06
Финальный
проект

5.

Финальный проект
Цель:
Формат:
Области:
Источники
данных:
применение
полученных знаний на
практике и погружение
в среду, аналогичную
реальному рабочему
процессу
совместная работа в
группах по 2-3 человека
телекоммуникация,
банкинг, недвижимость,
авиалинии, управление
персоналом
данные, находящиеся в
открытом доступе
(Kaggle.com, github.com).
Зачастую предоставляются
компаниями в рамках
соревнований

6.

Что нужно знать до
начала выступлений?
Структура выступлений
01
Введение в
проблему
02
Знакомство с
данными
03
Демонстрация результатов
разведочного анализа
o Углубление в проблему
o Анализ причин, связей,
закономерностей
o Заключительные выводы
04
Модели машинного
обучения
o Цели построения модели
o Подготовка данных
o Построение моделей
o Оценка производительности моделей
05
Выводы и
рекомендации

7.

Что нужно знать до
начала выступлений?
Вы можете столкнуться с незнакомой терминологией
Accuracy, Recall, Precision, confusion matrix
R2, RMSE
Линейная регрессия
Логистическая регрессия
Дерево решений
Оценивайте процесс, а не результат
модели машинного обучения
Вы не видите от 50 до 80%
результатов труда

8.

Спасибо за
внимание
Введение в
Data Science
Цель курса
Программа
Финальный проект
English     Русский Правила