3.33M
Категория: ПрограммированиеПрограммирование

Программирование на языке высокого уровня C++

1.

Богатов Р.Н.
Программирование
на языке высокого уровня
C++ ► Лекция 6 ► Символы. Кодировки. Строки
Кафедра АСОИУ ОмГТУ, 2020

2.

«Ходовые» типы данных
Тип
Размер
int
4
-2 млрд … 2 млрд
float
4
±10±38, точность – 7 разрядов
double
8
±10±308, точность – 15 разрядов
bool
1
true или false
char
1
-128 … 127 (код символа)
(байт)
Диапазон значений

3.

Символы
• Скольки-значный код потребуется для представления одного
символа текста?
• A…Z a…z 0…9 "!?.,:;№_-+*/%\=<>(){}[]@#$^&~|’
– это 26+26+10+32+… ≥ 94 символов
• 6 бит = 64 значения
7 бит = 128 значений
8 бит = 256 значений
• Изначальная идея: один символ – один байт. Коды 0…127 –
основной набор символов, коды 128…255 – для национального алфавита.
• ASCII – базовая 7-битовая кодировка для латинского алфавита и
основных символов. Кириллические кодировки (CP866, Windows CP1251,
KOI8-R и другие) отличаются только размещением русских букв в диапазоне
кодов 128…255.

4.

Кодировка Windows CP1251
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Ђ
Ѓ

ѓ






Љ

Њ
Ќ
Ћ
Џ
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
ђ






˜

љ

њ
ќ
ћ
џ
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
!
"
#
$
%
&
'
(
)
*
+
,
.
/
Ў
ў
Ј
¤
Ґ
¦
§
Ё
©
Є
«
¬
®
Ї
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
°
±
І
і
ґ
µ

·
ё

є
»
ј
Ѕ
ѕ
ї
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
А
Б
В
Г
Д
Е
Ж
З
И
Й
К
Л
М
Н
О
П
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ы
Ь
Э
Ю
Я
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
а
б
в
г
д
е
ж
з
и
й
к
л
м
н
о
п
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
р
с
т
у
ф
х
ц
ч
ш
щ
ъ
ы
ь
э
ю
я
ASCII

5.

Вставка символа в Microsoft Word
Unicode 128..65535
ASCII (128..255)
CP1251 (128..255)

6.

Фрагменты символов Unicode

7.

Символы в C++
// объявление и инициализация
char a, b;
// посмотреть кодировку
for (int i = 0; i < 256; i++)
printf("%c", i );
a = '7';
printf("%c", a);
printf("Code page #866:\n");
setlocale(LC_ALL, ".866"); // по умолчанию, можно не указывать
b = (char)55; // то же самое
printf("%c", b);
for (int i = 128; i < 256; i++)
printf("%c", i );
printf("\n\nCode page #1251:\n");
setlocale(LC_ALL, ".1251"); // или setlocale(LC_ALL, "Russian")
for (int i = 128; i < 256; i++)
printf("%c", i );

8.

Строки в C++
char s[6];
s[0] = 72;
s[1] = 101;
s[2] = 108;
s[3] = 108;
s[4] = 111;
s[5] = 0;
char s[6];
s[0] = 'H';
s[1] = 'e';
s[2] = 'l';
s[3] = 'l';
s[4] = 'o';
s[5] = 0;
char s[] = "Hello";
или
char s[] = { 72,
101, 108, 108, 111, 0 };
или
char s[] = {'H',
'e', 'l', 'l', 'o', 0 };
for (int i = 0; i < 5; i++)
printf("What's your name? ");
printf("%d", s[i] );
char x[20];
scanf("%s", x);
printf("Hi, %s!", x);
for (int i = 0; i < 5; i++)
printf("%c", s[i] );
printf("%s", s );

9.

Строки в C++ – нуль-терминированные
эксперимент!
////
строка
из двух
символов
// строка
из двух символов
//
найти
длину
строки
// найти string.h
длину
строки
char
s[]
=
"Hello,
World!";
//
напишем
свою
функцию,
чтобы
не
подключать
char a[3] = { 'H',
'i', 0 };
char a[]
= "Hi";
printf("Введите
текст:
printf("Введите
текст:
");
int mystrlen(char
s[])");
char
t[2000];
char t[2000];
printf("Вариант
1: символа
%s\n", s);
{
//
строка
из
одного
// строка
scanf("%s",
scanf("%[^\n]s",
t);
t);
scanf("%[^\n]s",
t);из одного символа
int
i
=
0;
char b[2] = { '!', 0 };
char b[] = "!";
s[5]
= 0; i++)
for(;;
intprintf("Вариант
i = 0;
2: %s\n",
s);
ifстрока
(s[i]==0)
break;
//
пустая
(без
текста)
// пустая строка (без текста)
for(;;
i++)
return
i;
char
= { 0 break;
};
char c[] = "";
ifc[1]
(t[i]==0)
= '!';
} s[5]
printf("Вариант 3: %s\n", s);
printf("В
тексте %d символов!", i); printf("В тексте %d символов!", strlen(t));
void main()
{ // затираем терминирующий ноль!
intprintf("Введите
N = strlen(s); текст: ");
s[N-1]
'.';
char =t[2000];
s[N]
= '.';
scanf("%1999[^\n]s",
t);
s[N+1]
= '.';тексте %d символов!", mystrlen(t));
printf("В
} printf("Вариант 4: %s\n", s);

10.

// Игра «Танчик» (см. лекцию №4). Было так:
...
int a[N][M];
const int brick = 177; // символ для стен
...
// А ещё быстрее вот так:
...
char a[N][M + 1]; // +1 символ для '\n'
const char brick = (char)177;
...
void field_init()
{
for (int i = 1; i < N-1; i++)
for (int j = 1; j < M-1; j++)
a[i][j] = ' ';
void field_init()
{
for (int i = 0; i < N; a[i][M]='\n', i++)
for (int j = 1; j < M-1; j++)
a[i][j] = ' ';
a[N - 1][M] = 0;
for (int i = 0; i < N; i++)
a[i][0] = a[i][M - 1] = brick;
for (int i = 0; i < N; i++)
a[i][0] = a[i][M - 1] = brick;
for (int j = 1; j < M-1; j++)
a[0][j] = a[N - 1][j] = brick;
for (int j = 1; j < M - 1; j++)
a[0][j] = a[N - 1][j] = brick;
}
void draw_field()
{
gotoxy(0, 0);
//system("cls");
for (int i = 0; i < N; i++, printf("\n"))
for (int j = 0; j < M; j++)
printf("%c", a[i][j]);
}
}
void draw_field()
{
gotoxy(0, 0);
//system("cls");
printf("%s\n", a);
}

11.

Перевод в шестнадцатеричную систему счисления
char s[8];
printf("Введите положительное целое: ");
intprintf("Введите
i=0;
положительное целое: ");
int n;
int n;
scanf("%d", &n);
do scanf("%d",
{
&n);
printf("Шестнадцатеричная запись:\n");
int x = n % 16;
printf("Шестнадцатеричная
запись:\n");
do {
n = n / 16;
do {
int x = n % 16;
char z;
int
x
=
n
%
16;
if( x<10 )
n = n / 16;
nz == n'0'
/ 16;
+ x;
char z;
printf("%d\n", x );
else
if( x<10 )
z = 'A' + x - 10;
z = '0' + x;
} s[i]
while= (n>0);
z;
else
i++;
z = 'A' + x - 10;
} while (n>0);
printf("%c\n", z );
// после цикла i - количество полученных цифр
} while (n>0);
// переворачиваем содержимое строки
for(int j=0; j<i/2; j++)
{
char c = s[j];
s[j]= s[i-j-1];
s[i-j-1] = c;
}
s[i]=0; // терминируем строку и выводим
printf("%s", s);

12.

Подсчёт встречаемости символа
printf("Input text: ");
char s[2000];
scanf("%[^\n]s", s);
int count = 0;
for (int i = 0; i < strlen(s); i++)
// считаем количество точек
if (s[i] == '.')
count++;
printf("Periods: %d", count);
// считаем количество цифр
if (s[i]
>= '0'
s[i] <= '9')
(s[i]=='0'
||&&
s[i]=='1'
|| s[i]=='2' ||
count++;

13.

Максимальная длина повтора одного символа
// повтор: решение задачи нахождения длины максимально длинной
// серии нулей в целочисленном массиве (из лекции №4 про массивы)
...
int max = 0;
for (int i = 0, length = 0; i < N; i++, max = max(max, length) )
if (a[i] == 0)
length++;
else
length = 0;
...
// решение той же задачи для строки символов (считаем серии точек)
...
int max = 0;
for (int i = 0, length = 0; i < strlen(s); i++, max = max(max, length) )
if (s[i] == '.')
length++;
else
length = 0;
...

14.

Подсчёт слов, начинающихся с заглавной буквы
printf("Input text: ");
printf("Input
text:
");
// оптимальное
решение:
char
s[2000];
char
s[2000];
// заранее
добавить
scanf("%[^\n]s",
s); перед текстом лишний пробел
scanf("%[^\n]s",
s); ");
printf("Input text:
char
s[2000]
int
count
= 0; = " ";
int
count;
scanf("%[^\n]s",
s+1);
for(int
i=0; i<strlen(s)-1;
i++)
// с первой буквой разбираемся отдельно
if ( s[i]==' ' && s[i+1]>='A' && s[i+1]<='Z' )
if
(
s[0]>='A'
int count
= 0; && s[0]<='Z' )
count++;
counti=0;
= 1;i<strlen(s)-1; i++)
for(int
else if ( s[i]==' ' && s[i+1]>='A' && s[i+1]<='Z' )
printf("There're
%d words that start with a capital letter\n", count);
countcount++;
= 0;
for(int
i=0; i<strlen(s)-1;
i++)start with a capital letter\n", count);
printf("There're
%d words that
if ( s[i]==' ' && s[i+1]>='A' && s[i+1]<='Z' )
count++;
printf("There're %d words that start with a capital letter\n", count);

15.

Использование string.h
printf("Guess my name? ");
printf("Login:
char
name[50]; ");
char login[200];
scanf("%s",
name);
scanf("%s", login);
// конвертирование всех букв в нижний регистр
// например,
проверка на
наличие
подстроки
//
"KaTe"
-> "kate"
if( strstr(login, "putin")!=NULL )
strlwr(name);
{
printf("Unknown
// проверка
на равенство error. Terminating...");
return; "stacy")==0 )
if( strcmp(name,
} printf("Correct!!!");
else
... printf("Not exactly...");

16.

Использование string.h
// Задача: в строке, содержащей путь и имя файла,
// изменить расширение в имени файла на "txt"
printf("Введите имя файла: ");
char filename[200];
scanf("%[^\n]s", filename);
int n = strlen(filename);
printf("Длина строки: %d\n", n );
// отсечение расширения вручную
int
j=-1;
// отсечение
расширения с помощью strrchr
for(int
i=n-1;
i>=0; i--)
char *p;
if (filename[i]=='.')
// поиск
первой точки при просмотре справа-налево
j
= i;
p = strrchr(filename,
'.');
if( p!=NULL )
if( j>-1
*p = )0; // затираем точку кодом конца строки
filename[j] = 0;
printf("Имя файла без расширения: %s\n", filename);
strcat(filename, ".txt"); // приклеиваем новое расширение
printf("Имя файла с новым расширением: %s\n", filename);

17.

Подсчёт количества гласных
...
char vowels[7] = "aeiouy";
int count = 0;
for (int i = 0; i < strlen(s); i++)
for (int j = 0; j < 6; j++)
if (s[i] == vowels[j])
{
count++;
break;
}
...
char* p = s;
int count = 0;
for (;; count++)
{
p = strpbrk(p+1, vowels);
if (p == NULL) break;
}
...
printf("There're %d vowels in the text.", count);

18.

Задачи на изменение текста
...
printf("Input text:\n");
//
заменим
цифры решёточками
char
s[2000];
scanf_s требует указания размера буфера,
for
(int i = 0; i < s,
strlen(s);
scanf_s("%[^\n]s",
2000); i++)
if (s[i] >= '0' && s[i] <= '9') чтобы предотвратить переполнение
// в задачах
текста правильнее создавать для результата новую строку
s[i] =изменения
'#';
char t[2000];
printf("\nChanged
text:
// заменим все буквы
на %s",
знак s);
подчёркивания
for (int i = 0; i < strlen(s) + 1; i++)
if (s[i] >= 'A' && s[i] <= 'Z' || s[i] >= 'a' && s[i] <= 'z')
t[i] = '_';
else
Догадайтесь, зачем это понадобилось
t[i] = s[i];
printf("\nText pattern:\n%s", t);

19.

Задачи, когда текст увеличивает свой объём
...
...
// продублируем каждый пробел
//
заменим точку на смайлик
...
char
t[4000]; // буфер должен быть достаточным для худшего случая
char
//
обернём
каждую цифру в квадратные скобки
int j t[8000];
= 0;
int
j t[6000];
= 0;
char
int(int
j = i0;= 0; i < strlen(s) + 1; i++)
for
{for (int i = 0; i < strlen(s) + 1; i++)
fort[j++]
(int
i= =s[i];
0;
< strlen(s) + 1; i++)
if (s[i]
== i'.')
(s[i]==>=' '0'
ifif(s[i]
') && s[i] <= '9')
t[j++] = ' ',
t[j++]= =' '[',
t[j++]
';
t[j++]
=
':',
t[j++] = s[i],
}
t[j++]= =']';
'-',
t[j++]
= ')';
else t[j++]
printf("\nWider
text:\n%s",
t);
t[j++]
=
s[i];
else
t[j++] = s[i];
printf("\nHighlighted digits:\n%s", t);
printf("\nJoyful edition:\n%s", t);

20.

Задачи, когда текст уменьшает свой объём
...
...
// удалим из текста последовательность "/ "
// удалим из текста повторяющиеся пробелы
char t[2000];
char t[2000];
int j = 0;
int j = 0;
//(int
эквивалентное
с использованием
флага
for
i = 0; i < решение
strlen(s)
+ 1; i++)
for
(int
i
=
0;
i
<
strlen(s)
+
1;
i++)
//if
работает
только
с s[i
s[i],
не ==
подсматривая
ни в s[i-1], ни в s[i+1]
(s[i] ==
'/' &&
+ 1]
' ')
if
(s[i]
!=
'
')
...
i++; // здесь и в последействии цикла for получится дважды i++
bool
secondspace
false;
t[j++] == s[i];
else
for else
(int
i = =
0;s[i];
i < strlen(s) + 1; i++)
t[j++]
if ( !(s[i]
== ' !=
' &&
secondspace) )
if (s[i+1]
' ')
t[j++] =text:\n%s",
s[i], secondspace = (s[i] == ' ');
printf("\nCleaned
t[j++] = s[i];t);
...
printf("\nNo double spaces:\n%s", t);

21.

Домашнее задание
Подсчитать количество «слов» в тексте, который введёт
пользователь. За «слово» считать любую последовательность
символов, не содержащую пробелов.
Пример текста: Точка (x1; y1) находится в … квадранте.
Ответ: в этом тексте 7 «слов»
Предлагаемая структура алгоритма:
• общий цикл, пока не кончится текст
• цикл пропуска пробелов (одного или нескольких идущих подряд)
• цикл пропуска не-пробелов (составляющих «слово»)
• инкрементирование счётчика слов

22.

Упражнения на работу с символами и текстом
( б е з и с п о л ь з о в а н и я s tr i n g.h )
Подсчитать количество артиклей «a» и «the» в данном тексте.
Проверить текст на наличие одной из ошибок вёрстки: перед
запятой никогда не должно быть пробела.
Определить, сколько в тексте различных символов.
Написать шифровщик текста, который просто прибавляет к коду
символа некоторую константу, которая является числом-паролем.
Подсчитать количества встречающихся в тексте символов.
Сделать генератор паролей, в которых обязательно должны
присутствовать и буквы, и цифры, и прочие символы.
Сделать массив строк из слогов и научиться генерировать
случайные фамилии, похожие на настоящие.
Повышенной сложности: а) удалить из текста все вхождения
заданной строки и б) вставить в нужные места текста символы или
строки (например, обернуть каждое слово «Вася» в скобки).

23.

Упражнения на работу с символами и текстом
( с и с п о л ь з о в а н и е м s tr i n g.h )
Выделить в тексте нужное слово ЗАГЛАВНЫМИ буквами.
Заменить в тексте все вхождения одной строки на другую.
Удалить из данного текста все повторяющиеся пробелы.
Очистить данный текст от любых символов кроме букв и
пробелов.
Найти все вхождения в заданном тексте пары подстрок s и t,
следующих друг за другом через любое количество (большее,
либо равное нулю) промежуточных символов.
Удалить из текста всё, что взято в скобки (включая скобки).
Перевернуть в тексте каждое слово по отдельности, оставляя
при этом заглавные буквы на первом месте. Например:
«Привет, Вася и Петя!» «Тевирп, Ясав и Ятеп!»
Получить словарь слов, встречающихся в тексте, в виде
массива строк.
English     Русский Правила