4.19M
Категория: ИнформатикаИнформатика

Машинное обучение. День 2. Классификация

1.

Машинное
обучение
День 2. Классификация.

2.

2
ПЛАН
День 2. Классификация.
01
ОСНОВЫ
10 МИН
Методы классификации: линейные методы,
решающие деревья.
03
ПЛАН РЕШЕНИЯ
ML-ЗАДАЧ 5 МИН
Решим 1 задачу по плану методами пакета
python -- sklearn.
Формальная постановка задачи ML. Основные
понятия и проблемы.
МЕТОДЫ
15 МИН
02
Как организован процесс решения ML-задачи. В
первом приближении.
ПРАКТИКА
10 МИН
04

3.

01
3
ОСНОВЫ
10 МИН
Постановка задачи и признаки
X – множество объектов / features
Y – целевое значение / target
f – решающая функция или алгоритм ML
X=
f(X)=Y
Типы признаков:
F2
F3
14.3
4
F4
F5
class
type1 127
2.8
1
13.35 5
type2 100
2.65
12
1
type1 101
2.8
3
17.1
4
type1 113
3.85
2
Y=
2
Кодирование категориальных признаков:
LabelEncoding
OneHotEncoding
количественные
категориальные
F1
Sex
male
female
F1
F2
Sex
0
1
male
1
0
female
F1
0
1

4.

01
4
ОСНОВЫ
10 МИН
Выборки и метрики
Этапы:
обучение (train)
Метрика
• Метрика – это число.
• Это показатель того, насколько хорошо работает наш алгоритм и какая у него
обобщающая способность.
• Метрика считается только на тестовой выборке
тестирование (test)
Accuracy
Метрика доли верно угаданных ответов (accuracy).
Разделение данных:
обучение (train) – 80%
тестирование (test) – 20%
Y_true
Y_pred
1
1
1
0
0
0
σ
English     Русский Правила