1.98M
Категория: ПрограммированиеПрограммирование

44. Аналитика данных на Python

1.

Краснодарский информационно
технологический техникум
ЛЕКЦИЯ №44
АНАЛИТИКА ДАННЫХ
НА Python

2.

ПРОВЕРКА ЗНАНИЙ
3 ТИПА АЛГОРИТМОВ:
• Линейный
• Разветвляющийся
• Циклический
Что такое словари/списки? Как к
ним обращаться? Какие
существуют методы работы?
2

3.

ВВЕДЕНИЕ В АНАЛИТИКУ
ДАННЫХ
3
Аналитика данных – это процесс
обнаружения, интерпретации,
коммуникации и представления значащих
шаблонов в данных.
Python, благодаря своим мощным
библиотекам, стал одним из самых
популярных языков для аналитики
данных.

4.

ОСНОВНЫЕ ЭТАПЫ АНАЛИЗА
ДАННЫХ
• Сбор данных: Получение данных из
различных источников (базы данных,
файлы, API).
• Очистка данных: Обработка
пропущенных значений, удаление
дубликатов, преобразование типов
данных.
• Предобработка данных:
Нормализация, стандартизация,
создание новых признаков.
4

5.

ОСНОВНЫЕ ЭТАПЫ АНАЛИЗА
ДАННЫХ
• Анализ данных: Применение
статистических методов, построение
моделей машинного обучения.
• Визуализация данных: Построение
графиков и диаграмм для представления
результатов анализа.
• Интерпретация результатов:
Формулировка выводов на основе
полученных результатов.
5

6.

ОСНОВНЫЕ БИБЛИОТЕКИ Python 6
ДЛЯ АНАЛИЗА ДАННЫХ
• NumPy: Библиотека для работы с
многомерными массивами и матрицами.
Обеспечивает высокопроизводительные
вычисления.

7.

ОСНОВНЫЕ БИБЛИОТЕКИ Python 7
ДЛЯ АНАЛИЗА ДАННЫХ
• Pandas: Библиотека для работы с
табличными данными (DataFrame).
Предоставляет удобные инструменты для
обработки, анализа и манипулирования
данными.

8.

ОСНОВНЫЕ БИБЛИОТЕКИ Python 8
ДЛЯ АНАЛИЗА ДАННЫХ
• Scikit-learn (sklearn): Библиотека,
предоставляющая широкий набор
алгоритмов машинного обучения для
классификации, регрессии,
кластеризации и др.

9.

ОСНОВНЫЕ БИБЛИОТЕКИ Python 9
ДЛЯ АНАЛИЗА ДАННЫХ
• Matplotlib: Библиотека для построения
двумерных графиков.

10.

БИБЛИОТЕКА NumPy
10
Для работы с библиотекой необходимо в
начале прописать строку, добавляющую
библиотеку в проект
import numpy as np

11.

БИБЛИОТЕКА NumPy
11
# Создание массива из списка
arr1 = np.array([1, 2, 3, 4, 5])
print(arr1)
print(type(arr1))
# <class 'numpy.ndarray'>

12.

БИБЛИОТЕКА NumPy
12
# Создание двумерного массива
arr2 = np.array([[1, 2], [3, 4]])
print(arr2)

13.

БИБЛИОТЕКА NumPy
# Создание массива из нулей
arr3 = np.zeros((2, 3))
print(arr3)
# Массив 2x3, заполненный нулями
13

14.

БИБЛИОТЕКА NumPy
14
# Создание массива из единиц
arr4 = np.ones((3, 2))
print(arr4)
# Массив 3x2, заполненный единицами

15.

БИБЛИОТЕКА NumPy
15
# Создание массива с заданным
значением
arr5 = np.full((2, 2), 7)
print(arr5)
# Массив 2x2, заполненный семерками

16.

БИБЛИОТЕКА NumPy
16
# Создание массива с случайными
числами
arr7 = np.random.rand(2, 3)
print(arr7)
# Массив 2x3 с случайными числами
от 0 до 1

17.

ОСНОВНЫЕ АТРИБУТЫ
МАССИВА
17
ndim: число измерений.
shape: размеры массива (кортеж).
arr = np.array([[1, 2, 3], [4, 5, 6]])
print(arr.ndim) # 2
print(arr.shape) # (2, 3)

18.

ИНДЕКСИРОВАНИЕ И СРЕЗЫ
18
Доступ к элементам массива
осуществляется с помощью индексов
(аналогично спискам).
arr = np.array([[1, 2, 3], [4, 5, 6]])
# Доступ к элементу
print(arr[1, 2]) # 6

19.

ИНДЕКСИРОВАНИЕ
# Изменение элемента
arr[0, 0] = 10
print(arr)
# Булево индексирование
print(arr[arr > 5]) # [6 7 8 9]
19

20.

Генерация случайных чисел
20

21.

ОПЕРАЦИИ С МАССИВАМИ
21

22.

ОПЕРАЦИИ С МАССИВАМИ
22

23.

ОПЕРАЦИИ С МАССИВАМИ
Матричное умножение
arr3 = np.array([[1, 2], [3, 4]])
arr4 = np.array([[5, 6], [7, 8]])
print(np.dot(arr3, arr4))
# [[19 22] [43 50]]
23
English     Русский Правила