ОЦЕНКА КОЛИЧЕСТВЕННЫХ ПАРАМЕТРОВ ТЕКСТОВЫХ ДОКУМЕНТОВ
Ключевые слова
685.50K
Категория: ИнформатикаИнформатика

Оценка количественных параметров текстовых документов. Обработка текстовой информации. Информатика и ИКТ. 8 класс

1. ОЦЕНКА КОЛИЧЕСТВЕННЫХ ПАРАМЕТРОВ ТЕКСТОВЫХ ДОКУМЕНТОВ

Информатика и ИКТ
ОЦЕНКА КОЛИЧЕСТВЕННЫХ
ПАРАМЕТРОВ ТЕКСТОВЫХ
ДОКУМЕНТОВ
ОБРАБОТКА ТЕКСТОВОЙ
ИНФОРМАЦИИ

2. Ключевые слова

• кодовая таблица
• восьмиразрядный двоичный код
• информационный объём текста

3.

Представление текстовой
информации в памяти компьютера
Текст состоит из символов - букв, цифр, знаков
препинания и т. д., которые компьютер различает по их
двоичному коду.
Соответствие между изображениями символов и кодами
символов устанавливается с помощью кодовых таблиц.
Кодовая таблица
0 – 32 - управляющие символы
ASCII
33 – 127 – латинские буквы,
знаки препинания, цифры, знаки
арифметических операций
128 – 256 – буквы национального
алфавита

4.

Представление текстовой
информации в памяти компьютера
Коды
русскихкодовой
букв в разных
кодировках
Фрагмент
таблицы
ASCII
Символ
Десятичный
код
Двоичный Кодировка
Символ Десятичный
код
код
Двоичный
код
Символ
Windows
КОИ-8и кодами
Соответствие
изображениями
символов
Пробел
32 между
00100000
0
48
00110000
десятичный
двоичный 1 десятичный
двоичный
символов
устанавливается
кодовых
таблиц.
!
33
00100001с помощью
49
00110001
#

35
код
код
00100011
2
код
код
50
00110010
36 192
110000003
00100100
225 51
11100001
00110011

42 193
00101010
110000014
226 52
00110100
11100010

43 194
00101011
110000105
247 53
00110101
11110111
,
44
00101100
6
54
00110110
-
45
00101101
7
55
00110111
Стандарт кодирования символов Unicode позволяет
_
46
8
56
00111000
пользоваться более
чем00101110
двумя языками.
/
47
00101111
00111001
В
Unicode
каждый 9 символ57
кодируется
A
65
010000001
78
01001110
шестнадцатиразрядным
двоичным Nкодом. Такое
количество
B
66
01000010
79
010001111
разрядов
позволяет
закодировать
65O 536 различных
символов:
01000011
P
80
01010000
216 =C65 536. 67

5.

Информационный объём фрагмента
текста
I – информационный объём сообщения
Задача
1.
Задача
Задача
2.3.
4.
K – количество
символов
I=K i
Автоматическое
устройство
осуществило
перекодировку
Выразите
в мегабайтах
объём
текстовой
информации
Считая,
что
каждый
символ
кодируется
одним
байтом,
В
кодировке
Unicode
на
каждый
символ отводится
двав
i

информационный
вес
символа
информационного
сообщения
на русском
языке,
первоначально
«Современном
словаре
иностранных
слов»
из 740
страниц,
определите,
чему
равен
информационный
объём
следующего
байта. Определите
информационный
объём
слова
из 24
записанного
в
8-битовом
коде,
в
16-битовую
кодировку
Unicode
. 80
При
если
на
одной
странице
размещается
в
среднем
60
строк
по
высказывания
Жан-Жака
Руссо:
В
зависимости
от
разрядности
используемой
кодировки
символов
в этой кодировке.
этом информационное
2048при
байтов.
Каков
символов
(включая сообщение
пробелы). увеличилось
Считайте, начто
записи
информационный
символа
текста,
создаваемого
на
Решение.
был информационный
объём
сообщения
до
перекодировки?
Тысячи
путей алфавит
ведутвес
к
заблуждению,
к символов.
истине
- только один.
использовался
мощностью
256
компьютере,
может быть равен:
Решение.
I Решение.
= 24 2 = 48 (байтов).
вес
каждого символа в 16-битовой кодировке в два
•В Информационный
8данном
битов (1
байт)57
- восьмиразрядная
тексте
символов (с учётом кодировка;
знаков препинания и
Ответ:
Kраза
= 740
48
80байтов.
информационного
60
больше
I = K i веса символа в 8-битовой кодировке.
пробелов).
символ исходного
байтом.
•NПоэтому
16
(2 байта)
- кодируется
шестнадцатиразрядная
приКаждый
перекодировании
блока одним
информации
из 8= 256битов
N = 2i
Следовательно,
информационный
объём всего текста
- 57
битовой кодировки
в 16-битовую его информационный
объём должен
кодировка.
текста - равную
это
был
другими фрагмента
словами, на величину,
Iбайтов.
-Информационный
? увеличиться вдвое, объём
исходному
информационному
объёму.
Следовательно,
количество
битов,
байтов
(килобайтов,
мегабайтов),
Ответ:
информационный
256 =57
2i байтов.
= 28, i объём
= 8 сообщения до перекодировки составлял 2048
необходимых для записи фрагмента оговорённым
байтов
= 2 Кб.
К = 740 80 60 8
= 28 416 000 бит = 3 552 000 байтов =
кодирования.
3,39 Мбайт.
=способом
3 468,75 Кбайт
Ответ: 2 Кбайта.
Ответ: 3,39 Мбайт.

6.

Самое главное
Текст состоит из символов - букв, цифр, знаков препинания и т. д.,
которые человек различает по начертанию. Компьютер различает
вводимые символы по их двоичному коду. Соответствие между
изображениями и кодами символов устанавливается с помощью
кодовых таблиц.
В
зависимости
от
разрядности
используемой
кодировки
информационный вес символа текста, создаваемого на компьютере,
может быть равен:
• 8 битов (1 байт) - восьмиразрядная кодировка;
• 6 битов (2 байта) - шестнадцатиразрядная кодировка.
Информационный объём фрагмента текста - это количество битов,
байтов (килобайтов, мегабайтов), необходимых для записи фрагмента
оговорённым способом кодирования.

7.

Вопросы и задания
РТ № 196
194 (стр. 84)
каждый символ
кодируется
8
В кодировке
какой ASCII
кодировочной
таблице
можно
Сообщение,
В Сообщение
Почему
текстовом
кодировки,
информационный
режиме
занимает
экран
всимвол
которых
6информационный
страниц
монитора
объём
каждый
покоторого
40
компьютера
символ
строк,
равен
в
Считая,
что
каждый
кодируется
одним
Считая,
что
каждый
символ
кодируется
16
битами,
С
какой
целью
была
введена
кодировка
Unicode?
закодировать
65
536 различных
символов?
битами.
Определите
объём
5 обычно
Кбайт,
кодируется
каждой
занимает
разбивается
строке
цепочкой
4 страницы
записано
на
из25восьми
строк
по
по
32
60
по
нулей
строки,
символов.
80следующей
символов
и единиц,
в каждой
в
байтом,
определите,
чему
равен
информационный
оцените
информационный
объем
сообщения
в этой
кодировке:
1)
ASCII
строке.
Информационный
из фразы
которых
Определите
называются
объём
объём
иначе
повысказывания
всего
текста,
однобайтовыми?
40
символов.
сообщения
занимающего
Сколько
равенвесь
28
объём
следующего
Алексея
А.записано
С. Пушкина
в кодировке
Unicode:
Длина
данного
текста
32котором
символа.
символов
800
байтам.
в
алфавите
Сколько
языка,
двоичных
на
разрядов
записано
было
экран
монитора,
в
кодировке
Unicode
.
2) Windows
Толстого:
нам
дана: Замена
счастию
она.
использовано
наэто
кодирование
сообщение?
одного
символа?
1)Привычка
32
бита свыше
НеКОИ-8
ошибается тот, кто ничего не делает, хотя это и
3)
1) 44 бита
2) 320 битов есть его основная ошибка.
4) Unicode
2) 704 бита
1)
битов
3) 512
32 байта
3) 44 байта
2)
4) 608
256 битов
байтов
4) 704 байта
3) 8 Кбайт
4) 123 байта

8.

Опорный конспект
Компьютер различает вводимые символы по их двоичному
коду. Соответствие между изображениями и кодами символов
устанавливается с помощью кодовых таблиц.
Информационный вес символа
8 битов
ASCII
Windows
16 битов
КОИ-8
Unicode
I=Kxi
I - информационный объём сообщения
K – количество символов
i – информационный вес символа

9.

Домашнее задание
§ 4.6 (стр. 174-180)
РТ № 192 - 213 (стр. 84)
English     Русский Правила