Кодування тексту. Таблиці кодів символів
Кодування текстових даних
Кодування текстових даних
цікаво
Кодування текстових даних
Кодування текстових даних
Кодування текстових даних
Кодування текстових даних
Кодування текстових даних
Кодування текстових даних
Для тих, хто хоче знати більше
Для тих, хто хоче знати більше
Для тих, хто хоче знати більше
1.89M
Категория: ИнформатикаИнформатика

Кодування тексту. Таблиці кодів символів

1. Кодування тексту. Таблиці кодів символів

КОДУВАННЯ ТЕКСТУ.
ТАБЛИЦІ КОДІВ
СИМВОЛІВ

2. Кодування текстових даних

КОДУВАННЯ ТЕКСТОВИХ ДАНИХ
Усі дані, які обробляються технічними пристроями, повинні
бути закодовані певним чином. Для опрацювання текстових
повідомлень з використанням комп’ютера символи
повідомлення кодують числами.
Для кодування тексту
використовують таблиці кодів
символів, у яких кожному символу,
що може бути використаний у
текстовому повідомленні,
поставлено у відповідність деяке
число.

3. Кодування текстових даних

КОДУВАННЯ ТЕКСТОВИХ ДАНИХ
У 1963 році у США було розроблено
таблицю таких кодів символів,
призначену для передавання
повідомлень телетайпом. Пізніше вона
стала стандартом для використання в
комп’ютерній техніці й отримала назву
таб лиця кодів символів ASCII (англ.
American Standard Code for Information
Interchange – американський
стандартний код для обміну
інформацією).

4. цікаво

ЦІКАВО
Телетайп (лат. tele – віддалений, англ. type — друкування) –
електромеханічна друкуюча машина, яку використовують для
передавання текстових повідомлень дротами.

5. Кодування текстових даних

КОДУВАННЯ ТЕКСТОВИХ ДАНИХ
У таблиці ASCII
літерам англійського
алфавіту, цифрам,
розділовим знакам,
символам редагування
та форматування
тексту поставлено у
відповідність числа
від 0 до 127.

6. Кодування текстових даних

КОДУВАННЯ ТЕКСТОВИХ ДАНИХ
Коди символів з таблиці
ASCII можна знайти за
адресою:
uk.wikipedia.org/wiki/ASCII

7. Кодування текстових даних

КОДУВАННЯ ТЕКСТОВИХ ДАНИХ
Таблиця кодів символів ASCII містить коди літер лише
англійського алфавіту. Для кодування літер інших алфавітів
було розроблено інші таблиці кодів символів. Наприклад,
таблиці КОІ8-U (КОІ – код обміну інформацією) та Windows1251 включають без змін усі коди таблиці ASCII, а також
містять коди літер кирилиці. Кодами цих літер є натуральні
числа в діапазоні від 128 до 255.
КОІ8-U
Windows1251

8. Кодування текстових даних

КОДУВАННЯ ТЕКСТОВИХ ДАНИХ
Таблиця кодів символів Windows1251 є стандартом для кодування
літер кирилиці в операційній системі
Windows. У ній, наприклад, літера «а»
українського алфавіту має код 224,
літера «і» – код 179, літера «ґ» – код
180 та ін. Коди символиз таблиці
Windows-1251 можна знайти за
адресою:
uk.wikipedia.org/wiki/Windows-1251

9. Кодування текстових даних

КОДУВАННЯ ТЕКСТОВИХ ДАНИХ
Цілих чисел від 0 до 255 вистачає,
щоб закодувати символи двох
алфавітів – латиниці та кирилиці –
та деякі інші символи. Але для
кодування символів інших алфавітів
(грецького та арабського алфавітів,
ієрогліфів тощо) потрібно значно
більше значень кодів. Для них
розроблено таблицю кодів символів
Юнікод (англ. Universal Code, Unicode
– універсальний код).

10. Кодування текстових даних

КОДУВАННЯ ТЕКСТОВИХ ДАНИХ
Таблиця Юнікод складається із 17 наборів по 65 536 значень кодів
у кожному та дає можливість закодувати 1 114 112 різних символів,
тобто майже всі символи писемності всіх світових мов. Як і в інших
таблицях кодів, у Юнікоді перші 128 кодів відповідають таблиці
ASCII. Окремий розділ у таблиці Юнікод містить коди літер
кирилиці.
Наприклад,
літера «а» українського алфавіту
має код 1072
літера «і» українського алфавіту
має код 1110
літера «ґ» українського алфавіту
має код 1169

11.

ПОРІВНЯННЯ СТРУКТУРИ ТАБЛИЦЬ КОДІВ СИМВОЛІВ

12. Для тих, хто хоче знати більше

ДЛЯ ТИХ, ХТО ХОЧЕ ЗНАТИ БІЛЬШЕ
У табличному процесорі Excel є функції, призначені для
визначення коду заданого символа, а також за заданим кодом –
відповідного символа в кодових таблицях Windows-1251 та
Юнікод:
CODE
UNICODE
CHAR
UNICHAR
визначення коду заданого символа в кодовій таблиці Windows-1251;
визначення коду заданого символа в кодовій таблиці Юнікод;
визначення символа за його числовим кодом у таблиці Windows-1251;
визначення символа за його числовим кодом у таблиці Юнікод.

13. Для тих, хто хоче знати більше

Розділ 1
§ 1.2
У таблиці Юнікод
неЗНАТИ
лише літер
і цифр, а й символів,
ДЛЯмістяться
ТИХ, ХТО коди
ХОЧЕ
БІЛЬШЕ
які позначають торгові марки, грошові одиниці, символи транскрипцій,
ідеограми тощо. Наприклад, кодом символа української грошової одиниці
гривні ₴ є число 8372, кодом ідеограми чоловік є число 4036002432, а
ідеограми жінка – число 4036002433 тощо (коди цих символів не є їх
порядковими номерами).
Ідеограма — писемний знак, що передає, на
відміну від букви, не звук певної мови, а деяке
поняття, ідею.

14. Для тих, хто хоче знати більше

ДЛЯ ТИХ, ХТО ХОЧЕ ЗНАТИ БІЛЬШЕ
Для вставлення символів у текстовий документ можна
застосовувати їхні коди з таблиці Юнікод. Для цього потрібно
натиснути та утримувати клавішу Alt і набрати код символа
на додатковій цифровій клавіатурі. Так, можуть бути
вставлені, наприклад,
символи
серце у вигляді
шахова фігура
нота – код
сніговик - код
9731

квітки – код
10087

9834

кінь – код 9822
та інші.

English     Русский Правила