1.54M
Категория: ИнформатикаИнформатика

Подготовка данных ИС -1 2022

1.

Подготовка данных
ИС-1
2022

2.

Роль данных
O Низкое качество данных
O Прекрасный анализ
O Результаты некачественные
2

3.

Формат данных
ID
Покупатель
Дата
1
Пингвин
1 янв.
1
да
5,3
2
Медведь
1 янв.
4
да
9,7
3
Кролик
1 янв.
6
Нет
6,5
4
Лошадь
2 янв.
6
нет
5,5
5
Пингвин
2 янв.
2
Да
6,0
6
Жираф
3 янв.
5
Нет
4,8
7
Кролик
3 янв.
8
Нет
7,6
8
Кот
3 янв.
?
да
7,4
Кол-во Куплена
фруктов
рыба
Потрачено, $
3

4.

Переформатированный
набор данных
Дата
Выручка,
$
Число
покупателей
Погода
Выходные
1 янв.
21,5
3
солнце
да
2 янв.
11,5
2
дождь
нет
3 янв.
19,8
3
солнце
нет
4

5.

Типы переменных
O Бинарная
O Категориальная
O Целочисленная
O Непрерывная
5

6.

Выбор переменных
O Выбор короткого списка важнейших
переменных
O Метод проб и ошибок (учет
промежуточных результатов)
O Использовать простые графики для
выявления корреляций
6

7.

Конструирование признаков
O Уменьшение
размерности путем
использования более
широких категорий
O Используется для
извлечения самой
полезной информации
7

8.

Неполные данные
O Приближение
O Вычисление
O Удаление
8

9.

Задание на выполнение
лабораторной работы №1
1.
2.
3.
4.
5.
6.
Создать модель предметной области в виде таблицы
в Excel.
Наполнить модель данными.
Получить статистическую информацию на основе
введенных данных (суммы, среднее значение,
минимальные, максимальные по всему набору и на
заданной выборке).
Выдвинуть 5-7 гипотез о зависимостях в данной
предметной области
Сформировать 3-4 переформатированных набора
данных с использованием дополнительных
переменных для проверки гипотез.
Проверить гипотезы путем построения
графиков/диаграмм.
9
English     Русский Правила