Лекция 1
Предмет и задачи информатики
Предмет и задачи информатики
Существует три определения информации
Определение информации (продолжение)
Определение информации (окончание)
Свойства информации
Свойства информации
Свойства информации (окончание)
Кодирование и измерение информации
кодирование и измерение информации (продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации продолжение)
кодирование и измерение информации (продолжение)
измерение информации
измерение информации
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Кодирование и измерение информации (продолжение)
Список литературы
1.41M
Категория: ИнформатикаИнформатика

Предмет и задачи информатики. Свойства информации. Кодирование и измерение информации (Лекция 1)

1. Лекция 1

Предмет и задачи
информатики. Свойства
информации. Кодирование и
измерение информации
Разработала Фаерштейн
Л.В.

2.

СОДЕРЖАНИЕ
1. Предмет и задачи информатики
2. Определение информации
3. Свойства информации
4. Кодирование и измерение
информации
Выход
2

3. Предмет и задачи информатики

ПРЕДМЕТ И ЗАДАЧИ ИНФОРМАТИКИ
Определение
Информатика – комплексная
инженерная дисциплина для
проектирования, создания и
применения систем обработки
информации в разных областях
социальной практики.
3

4. Предмет и задачи информатики

ПРЕДМЕТ И ЗАДАЧИ ИНФОРМАТИКИ
Делится на две группы:
1) безмашинная (рутинная)
2) машинная (с использованием
ЭВМ)
Объектом изучения является
информация.
4

5. Существует три определения информации

СУЩЕСТВУЕТ ТРИ ОПРЕДЕЛЕНИЯ ИНФОРМАЦИИ
1. с содержательной точки
зрения – сведения, уменьшающие
неопределённость
2. с формальной точки зрения –
это набор символов (сигналов)
3. с юридической точки зрения –
сведения о людях, событиях,
процессах или явлениях
независимо от формы их
представления
5

6. Определение информации (продолжение)

ОПРЕДЕЛЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Определение
3
взято
из
федерального закона № 149-ФЗ от
2008г.
«Об
информации,
информатизации
и
защите
информации», который изучается
самостоятельно.
6

7. Определение информации (окончание)

ОПРЕДЕЛЕНИЕ ИНФОРМАЦИИ (ОКОНЧАНИЕ)
Понятие информации появилось
тогда, когда невозможно стало
описать материальные объекты
на языке материальных моделей.
Информатика, таким образом,
изучает информационные модели
объектов
и
информационные
связи между объектами.
7

8. Свойства информации

СВОЙСТВА ИНФОРМАЦИИ
1.Объективность
и
субъективность
(относительные понятия; чем
большей
обработке
подвергается информация, тем
более она субъективна, так как
методы обработки считаются
субъективными).
Свойство
учитывается
в
8

9. Свойства информации

СВОЙСТВА ИНФОРМАЦИИ
 
2. Полнота (от количества
информации зависит
количество методов для ее
обработки)
3. Достоверность (зависит от
уровня информационного шума
и требует либо бльшего числа
данных либо более сложных
методов обработки)
9

10. Свойства информации (окончание)

СВОЙСТВА ИНФОРМАЦИИ (ОКОНЧАНИЕ)
Адекватность (степень
соответствия реальному
состоянию событий)
5. Доступность (мера
возможности получения
информации)
6. Актуальность (степень
соответствия информации
текущему моменту времени).
4.
10

11. Кодирование и измерение информации

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ
Кодирование

это
совокупность
правил
для
обозначения
элементов
исходного множества набором условных
символов.
Включает
в
себя:
1)
алфавит
(конечное
множество
символов, используемых для кодирования)
2)
Количество
символов
алфавита
(мощность)
11

12. кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Примеры.
1. Мощность русского алфавита
составляет 56 символов. В алфавит
входят:
- буквы от А до Я
- цифры от 0 до 9
- знаки препинания (. , ; : ! ? № «» … )
- служебные символы (%, ‘, знаки
операций, скобки () и др.)
12

13. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
2. Особое место занимает
двоичный алфавит, мощность
его равна двум и в состав
входит всего два знака: 0 и 1.
Определение. Величина,
способная принимать только
два значения 0 или 1,
называется битом.
13

14. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
Бит является стандартной
минимальной единицей
количества информации и
минимальной (не адресуемой)
единицей памяти ЭВМ.
Неадресуемость означает, что к
конкретному биту в памяти ЭВМ
нельзя обратиться по номеру
этого бита.
14

15. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
 Любое число или символ в ЭВМ
представлены в двоичном алфавите,
который содержит только две цифры – 0 и
1.
Число 10 – это переход уже в следующий
разряд, где 1 означает количество двоек, 0
– количество единиц, т.е. .
Как перевести число из десятичной
(арабской) системы счисления в двоичную?
Существует два способа такого перевода.
15

16. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
 Самым простым является способ
деления в «столбик», остатки от
деления записываются справа
20:2|0
10:2|0
5:2 |1
2:2 |0
1
Последнее частное и все остатки
записываются снизу вверх
16

17. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
 
Проверка. Разложив двоичное
число по степеням числа 2
(система двоичная!), начиная с
правого разряда, где число 2 в
степени 0, получим
17

18. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
Подобным способом можно
перевести число из арабской системы
в любую другую с любым основанием.
Часто используются системы
троичная (состоит из цифр 0, 1, 2 –
основание 3), восьмеричная (состоит
из цифр от 0 до 7 – основание 8) и
шестнадцатеричная (состоит из
цифр от 0 до 9 и букв A, B, C, D, E, F –
основание 16).
18

19. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
Таблица соответствия
десятичных цифр 16-теричным:
1610терична
тичная
я
0-9
10
11
12
0-9
A
B
C
10тичная
13
14
15
16
16терична
я
D
E
F
10
19

20. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
Способ перевода такой же – в
«столбик», остатки (числа от 0 до
15) записываются справа.
2186:16|10 (А)
136:16|8
8
Записываем снизу вверх,
начиная с частного: 88A
20

21. кодирование и измерение информации продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ ПРОДОЛЖЕНИЕ)
 Проверка.
21

22. кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Измерение информации
осуществляется тремя методами
по разным формулам:
1) объёмным
2) вероятностным
3) алгоритмическим, который не
рассматриваем.
22

23. измерение информации

ИЗМЕРЕНИЕ ИНФОРМАЦИИ
Метод 1. Для определения
количества информации H (в битах) в
объемном методе используется
формула Хартли
H K log 2 N
(1)
N- число знаков (символов) в
алфавите, которым закодировано
сообщение
K – длина сообщения в символах
23

24. измерение информации

ИЗМЕРЕНИЕ ИНФОРМАЦИИ
Рассмотрим
сначала
объем
информации
для
числовых
сообщений.
Число может быть представлено
в разных системах счисления –
двоичной,
десятичной,
четверичной, восьмеричной и т.д.
24

25. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Пусть
 
для примера любое
сообщение имеет длину 1 цифру
(символ), а алфавиты (т.е. системы
счисления) разные.
Если N=2, 1 (бит)
Если N=4, 2 (бита)
Если N=8, 3 (бита)
Если N=10, 3,32 (бита)
25

26. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Т.е.
количество
информации,
которое содержит одна цифра в
арабской (десятичной) системе
счисления составляет 3,32 бита.
26

27. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
 А
теперь пусть сообщение
представлено
в
русском
алфавите, мощность которого 56
символов.
Определим
объем
информации, который содержится
в названии нашего города Пермь.
Длина сообщения
27

28. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
 Тогда объём информации
5,8 (бита)
(т.е. один символ русского
алфавита содержит информацию
в 5,8 бит)
28

29. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
 Китайский алфавит имеет около
2000 символов плюс цифры,
служебные знаки типа %, скобки,
знаки
операций
и
др.
(22
символа).
Сколько информации содержит
1 символ китайского алфавита)?
29

30. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Также за единицу измерения
принимается
количество
информации,
полученное
в
результате
опыта,
в
котором
возможны только два различных
исхода,
например,
бросание
монеты.
Эта
единица
также
называется бит и является вторым
его определением.
30

31. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Формула (1) считает информацию в
битах. Но бит – маленькая величина
(как копейка). Для измерения
используются также байты (8 бит) и
кратные им единицы.
1 байт = 8 бит
1 кбайт = 1024 байт
1 Мбайт = 1024 кбайт
1 Гбайт = 1024 Мбайт
1 Тбайт = 1024 Гбайт
31

32. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Метод 2. Для измерения количества
информации существует вероятностный
метод.
Метод
использует
разную
вероятность появления символов в
одном и том же алфавите (русском,
английском и др.). Вероятностью
появления
цифр
и
служебных
символов в обычном (не научном)
тексте пренебрегают, т.к. она мала.
32

33. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Так, в русском алфавите
чаще всего встречаются буквы
«о, п, а, е, н», у них самая
большая
вероятность
появления в тексте.
Самая
маленькая
вероятность – у буквы «ъ».
33

34. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
  Количество
информации
по
методу 2 считается по формуле
Шеннона (2)
(2)
N – количество одинаковых
символов в сообщении
- вероятность появления символа в
алфавите (частота встречаемости)
34

35. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Пример 2. Найти количество
информации в сообщении Пермь
по методу 2.
Воспользуемся
справкой
вероятности появления букв и
составим такую таблицу
35

36. измерение информации (продолжение)

ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
букв Количе Вероятн
а
ство N
ость
п
1
0,082
3,608
3,608
е
1
0,082
3,608
3,608
р
1
0,1
3,322
3,322
м
1
0,07
3,837
3,837
ь
1
0,0018
9,118
9,118
всего
23,493 (бит)
36

37. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
  Т.к. сообщение (текст) небольшой, оно
содержит мало информации, около 6 байт
(.
Объём информации в методе 2 зависит:
1) от длины сообщения (текста)
2) от частоты использования букв
«о, п, е, а, н», т.к. эти буквы чаще всего
встречаются в русскоязычных текстах
Метод 2 более точный.
37

38. Кодирование и измерение информации (продолжение)

КОДИРОВАНИЕ И ИЗМЕРЕНИЕ ИНФОРМАЦИИ (ПРОДОЛЖЕНИЕ)
Для измерения памяти ЭВМ (и
для доступа к памяти) биты не
используются, а используется т. н.
машинное слово
1 слово = 2 байта
1 двойное слово = 4 байта
1 расширенное слово = 8 байт
38

39.

Задача.
Какое сообщение
информативнее
(содержит
больше информации) – K1 длиной
600 символов, закодированное
алфавитом мощностью 8 знаков,
или K2 длиной 900 символов,
закодированное
алфавитом
мощностью 4 знака?
39

40.

Решение. Раз ничего не известно
о вероятности появления символов
ни в одном, ни в другом алфавите,
значит, объём информации находим
по методу Хартли (1).
H K log 2 N , где N мощность
алфавита, K длина сообщения
Один символ алфавита мощностью 8
знаков по формуле Хартли содержит
такое количество информации:
40

41.

log 2 8 3 (бита)
Один символ алфавита мощностью 4
знака содержит
log 2 4 2(бита)
600 символов 3 бита 1800 (бит)
900 символов 2 бита 1800 (бит)
Вывод: оба сообщения содержат
одинаковое количество
информации.
41

42. Список литературы

СПИСОК ЛИТЕРАТУРЫ
1.В.А. Острейковский. Информатика. –
М.:Высш.шк. – 2003, 2008
2.В.З. Аладьев и др. Основы
информатики. Учебное пособие. М.:Филинъ – 2005, 2010
42
English     Русский Правила