Обработка текстовых файлов

1.

Обработка
текстовых файлов

2.

Pandas

3.

Data Frame

4.

Чтение из файла
Тип
Представление
csv
pd.read_csv('data.csv')
xls xlsx
pd.read_excel('data.xlsx')
Параметры
enconding = 'utf-8',
header=None
dtype= str
sep= ' '
skiprows= 0
index_col= None

5.

Запись в файл
Тип
Представление
csv
df.to_csv('data.csv')
xls xlsx
df.to_excel('data.xlsx')
Параметры
sheet_name='name'
header= ['name', 'name2' ]
sep= '|'
index=False
index_label= 'name'

6.

Добавление строки

7.

Добавление строк

8.

Добавление столбца

9.

Удаление столбцов

10.

Преобразование
типов данных
Название
Представление
Перевод всего фрейма
df = df.astype(int)
Перевод одного столбца
df['a'] = df['a'].astype(int)
Перевод набора столбцов
df = df.astype({'a': int, 'b': str})

11.

Удаление строк

12.

Решение задач

13.

Задача 1
• Создайте xls - файл, содержащий
информацию о росте и весе людей
• Считайте информацию из файла и
вычислите индекс массы тела для каждого
человека
• Оставьте в датафрейме только те записи, где
индекс массы тела > 16
• Запишите информацию в tsv - файл

14.

Изменение
значений столбца

15.

Apply

16.

Apply к функции

17.

Apply к функции
с аргументами

18.

Задача 2
Для каждого индекса массы тела сделайте
расшифровку и сохраните результат в файл
Индекс
Расшифровка
16<= I <= 18.5
Дефицит
18.5 < I <= 25
Норма
I > 25
Избыточная масса

19.

Задача 3
Визуализируйте соотношение индексов масс
тела
Дифицит
Норма
Избыточная масса
English     Русский Правила