3.59M
Категория: ИнформатикаИнформатика

М1У3

1.

Модуль 1. Урок 3.
Электронный учебник

2.

Модуль 1. Урок 3. Кодирование информации
Кодирование информации

3.

➔ Текст, числа и символы обычно объединены в общие
кодовые таблицы.
➔ Существует ряд общепринятых кодовых таблиц:
◆ ASCII;
◆ Unicode;
◆ КОИ–7;
◆ КОИ–8;
◆ Windows​–1251.
Кодирование информации
Виды символьных кодовых таблиц

4.

В тексте двоичным кодом записываются
все символы, в том числе и пробелы.
Поэтому для удобства декодирования
используют коды одинаковой длины.
Такой код называют равномерным.
01001000|01101001|00100000|01100110|01110010|01101001|01100101|01101110|01100100|00100001
H
i
пробел
f
r
i
e
n
d
!
Компьютер может разделить код сообщения на равные части и
декодировать их.
Кодирование информации
Равномерный двоичный код

5.

1. Коды должны быть одинаковой
длины.
2. Коды не должны повторяться.
3. Коды должны состоять из
минимального количества знаков.
Кодирование информации
Правила составления кодовых таблиц

6.

Кодовая таблица должна содержать все
символы, которые могут потребоваться для
кодирования предполагаемых сообщений.
Примечание:
● часто букву Е и Ё приравнивают по значению
и для них составляют единый код;
● если при кодировании нет необходимости
соблюдать заглавные и строчные буквы, то
их коды будут равны.
Кодирование информации
Правила составления кодовых таблиц

7.

Мощность алфавита = 2 количество двоичных знаков
N = 2i
Кодирование информации
Количество символов в алфавите
(мощность алфавита) = числу 2 в
степени количества двоичных знаков на
один символ.

8.

В таком случае необходимо брать
ближайшую степень двойки с избытком.
Например, если в алфавите 33 символа,
то ближайшей степенью будет 64.
Следовательно, на один символ будет
отведено 6 двоичных разрядов (64 = 26).
Кодирование информации
А как определить количество двоичных
знаков на один символ, если в алфавите
5, 7 или 25 символов?

9.

А — 10
Т — 110
Ч — 1111
➔ Неравномерный двоичный код может использоваться с
целью оптимизации.
➔ При таком подходе наименьшее количество двоичных
разрядов отводится на наиболее часто встречающуюся
букву.
Кодирование информации
Неравномерный двоичный код

10.

Также неравномерный двоичный код используется в
шифровании, так как по статистике подобные шифры
являются наиболее устойчивыми к взлому.
Кодирование информации
Неравномерный двоичный код

11.

1. Наиболее часто встречающиеся элементы
должны иметь наименее длинный код.
2. Коды должны удовлетворять условию
Фано.
Условие Фано
Ни один код не должен быть началом другого (более длинного)
кода.
Кодирование информации
Правила составления кодовых таблиц
с неравномерными кодами

12.

0
1
А
0
1
0
1
0
К
И
Р
1
0
1
Т
Ц
а
к
и
р
т
ц
0
100
101
110
1110
1111
Код для
буквы Т
1110
Кодирование информации
Пример составления кодовой таблицы
с неравномерными кодами для букв слова КАРАКАТИЦА.

13.

Декодируем слово 0110101110010110,
используя дерево, представленное ниже.
0
1
0
1
0
1
А
0
1
0
1
0
Е
В
К
И
Р
1
0
1
Т
Ц
Кодирование информации
Задача

14.

0
1
0
1
0
1
А
0
1
0
1
0
Е
В
К
И
Р
011 | 010 | 1110 | 010 | 110
В
Е
Т
Е
Р
1
0
1
Т
Ц
Кодирование информации
Решение
English     Русский Правила