Похожие презентации:
44. Аналитика данных на Python
1.
Краснодарский информационнотехнологический техникум
ЛЕКЦИЯ №44
АНАЛИТИКА ДАННЫХ
НА Python
2.
ПРОВЕРКА ЗНАНИЙ3 ТИПА АЛГОРИТМОВ:
• Линейный
• Разветвляющийся
• Циклический
Что такое словари/списки? Как к
ним обращаться? Какие
существуют методы работы?
2
3.
ВВЕДЕНИЕ В АНАЛИТИКУДАННЫХ
3
Аналитика данных – это процесс
обнаружения, интерпретации,
коммуникации и представления значащих
шаблонов в данных.
Python, благодаря своим мощным
библиотекам, стал одним из самых
популярных языков для аналитики
данных.
4.
ОСНОВНЫЕ ЭТАПЫ АНАЛИЗАДАННЫХ
• Сбор данных: Получение данных из
различных источников (базы данных,
файлы, API).
• Очистка данных: Обработка
пропущенных значений, удаление
дубликатов, преобразование типов
данных.
• Предобработка данных:
Нормализация, стандартизация,
создание новых признаков.
4
5.
ОСНОВНЫЕ ЭТАПЫ АНАЛИЗАДАННЫХ
• Анализ данных: Применение
статистических методов, построение
моделей машинного обучения.
• Визуализация данных: Построение
графиков и диаграмм для представления
результатов анализа.
• Интерпретация результатов:
Формулировка выводов на основе
полученных результатов.
5
6.
ОСНОВНЫЕ БИБЛИОТЕКИ Python 6ДЛЯ АНАЛИЗА ДАННЫХ
• NumPy: Библиотека для работы с
многомерными массивами и матрицами.
Обеспечивает высокопроизводительные
вычисления.
7.
ОСНОВНЫЕ БИБЛИОТЕКИ Python 7ДЛЯ АНАЛИЗА ДАННЫХ
• Pandas: Библиотека для работы с
табличными данными (DataFrame).
Предоставляет удобные инструменты для
обработки, анализа и манипулирования
данными.
8.
ОСНОВНЫЕ БИБЛИОТЕКИ Python 8ДЛЯ АНАЛИЗА ДАННЫХ
• Scikit-learn (sklearn): Библиотека,
предоставляющая широкий набор
алгоритмов машинного обучения для
классификации, регрессии,
кластеризации и др.
9.
ОСНОВНЫЕ БИБЛИОТЕКИ Python 9ДЛЯ АНАЛИЗА ДАННЫХ
• Matplotlib: Библиотека для построения
двумерных графиков.
10.
БИБЛИОТЕКА NumPy10
Для работы с библиотекой необходимо в
начале прописать строку, добавляющую
библиотеку в проект
import numpy as np
11.
БИБЛИОТЕКА NumPy11
# Создание массива из списка
arr1 = np.array([1, 2, 3, 4, 5])
print(arr1)
print(type(arr1))
# <class 'numpy.ndarray'>
12.
БИБЛИОТЕКА NumPy12
# Создание двумерного массива
arr2 = np.array([[1, 2], [3, 4]])
print(arr2)
13.
БИБЛИОТЕКА NumPy# Создание массива из нулей
arr3 = np.zeros((2, 3))
print(arr3)
# Массив 2x3, заполненный нулями
13
14.
БИБЛИОТЕКА NumPy14
# Создание массива из единиц
arr4 = np.ones((3, 2))
print(arr4)
# Массив 3x2, заполненный единицами
15.
БИБЛИОТЕКА NumPy15
# Создание массива с заданным
значением
arr5 = np.full((2, 2), 7)
print(arr5)
# Массив 2x2, заполненный семерками
16.
БИБЛИОТЕКА NumPy16
# Создание массива с случайными
числами
arr7 = np.random.rand(2, 3)
print(arr7)
# Массив 2x3 с случайными числами
от 0 до 1
17.
ОСНОВНЫЕ АТРИБУТЫМАССИВА
17
ndim: число измерений.
shape: размеры массива (кортеж).
arr = np.array([[1, 2, 3], [4, 5, 6]])
print(arr.ndim) # 2
print(arr.shape) # (2, 3)
18.
ИНДЕКСИРОВАНИЕ И СРЕЗЫ18
Доступ к элементам массива
осуществляется с помощью индексов
(аналогично спискам).
arr = np.array([[1, 2, 3], [4, 5, 6]])
# Доступ к элементу
print(arr[1, 2]) # 6
19.
ИНДЕКСИРОВАНИЕ# Изменение элемента
arr[0, 0] = 10
print(arr)
# Булево индексирование
print(arr[arr > 5]) # [6 7 8 9]
19
20.
Генерация случайных чисел20
21.
ОПЕРАЦИИ С МАССИВАМИ21
22.
ОПЕРАЦИИ С МАССИВАМИ22
23.
ОПЕРАЦИИ С МАССИВАМИМатричное умножение
arr3 = np.array([[1, 2], [3, 4]])
arr4 = np.array([[5, 6], [7, 8]])
print(np.dot(arr3, arr4))
# [[19 22] [43 50]]
23
Программирование