Со строками мы с вами работали практически в каждой нашей программе и до этого урока. Точнее со строковыми константами – последовательностью символов в двойных кавычках. Нам часто доводилося виводити на екран ту чи іншу інформацію. Наприклад:
Текст в кавычках и есть строковая константа. Кавычки используются для определения начала и конца строковой константы и её частью не являются.
Досить часто необхідно не тільки друкувати якісь короткі повідомлення по ходу програми, а и работать с определённым текстом, хранить его где-то, обращаться к нему и редактировать, по необходимости. К строковой константе, рассмотренной выше, мы не сможем обратиться в программе, например для того, чтобы перезаписать её (мы не знаем ни ее имени ни адреса в памяти). Зараз ви дізнаєтеся про один із способів роботи з рядками в C ++. Позже мы познакомимся ещё с одним способом – використанням класса string.
Итак о первом: в C ++ для зберігання рядків використовують символьні масиви. Это такие же массивы, как мы с вами уже рассматривали в статье о массивах в С , но хранят они не числовые данные, а символьные. Можна уявити символи такого масиву розташованими послідовно в сусідніх комірках пам'яті – в каждой ячейке хранится один символ и занимает один байт. Один байт потому, что каждый элемент символьного массива имеет тип CHAR. Последним символом каждой такой строки является символ \0 (нулевой символ). Наприклад:
Сам текст, включая пробел, состоит из 11-ти символов. Якби в останній комірці перебувала наприклад . (точка), а не нулевой символ \0 – для компилятора это уже не строка. И работать с таким набором символов надо было бы, як зі звичайним масивом – записывать данные в каждую ячейку отдельно и выводить на экран посимвольно (при помощи цикла):
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | #include <iostream> using namespace std; int main() { setlocale(LC_ALL, "rus"); char str[12] = {'Ж','и','л','-','б','ы','л',' ','п','ё','с','.'}; for (int i = 0; i < 12; i++) { cout << str[i]; } cout << endl; return 0; } |
На щастя в C ++ є куди більш зручний спосіб ініціалізації і звернення до символьних масивів – рядкам. Для этого последним символом такого массива обязательно должен быть нулевой символ \0. Саме він робить набір символів рядком, работать с которой, гораздо легче, чем с массивом символов.
Объявляется строка таким образом – создаем массив типа char, розмір в квадратних дужках вказувати не обов'язково (его подсчитает компилятор), оператор = и в двойных кавычках пишем необходимый текст. То есть инициализируем массив строковой константой:
1 2 3 4 5 6 7 8 9 10 11 12 13 | #include <iostream> using namespace std; int main() { setlocale(LC_ALL, "rus"); char str[] = "Жил-был пёс"; // '\0' присутствует неявно cout << str << endl; return 0; } |
Прописывать нулевой символ не надо. Він присутній неявно і додається в кожну таку строкову константу автоматично. Таким образом, при том что мы видим 11 символов в строке, размер массива будет 12, так как \0 тоже символ и занимает один байт памяти. Займет он последнюю ячейку этого символьного массива.
Як бачите, для вывода строки на экран, досить звернутися до неї по імені: cout << str << endl; cout будет выводить на экран символ за символом, пока не встретит в одной из ячеек массива символ конца строки \0 і висновок перерветься. Таке звернення для звичайного символьного масиву (массива без \0) неприпустимо.
Так як компілятор виводив би символи на екран навіть вийшовши за рамки масиву, пока не встретил бы в какой-то ячейке памяти символ \0. Можете спробувати підставити в перший приклад замість циклу операторcout << str << endl; и увидите, что получится. У меня показало вот так:
Хочу обратить ваше внимание на отличие символьной константы (в одинарных кавычках – 'F', '@' ) от строковой константы (в подвійних лапках "f", "@" ). Для первой, компилятором C выделяется один байт для хранения в памяти. Для символу записаного в подвійних лапках, будет выделено два байта памяти – для самого символа и для нулевого (добавляемого компилятором).
Що якщо рядок повинен буде ввести користувач з клавіатури? В цьому випадку необхідно оголоситимасив типуchar із зазначенням його розміру достатнього для зберігання символів, що вводять, включая \0. Не забувайте про це нульовому символі. Если вам надо хранить 3 символа в массиве, его размер должен быть на единицу больше – тобто 4.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | #include <iostream> using namespace std; int main() { setlocale(LC_ALL, "rus"); char siteName[20] = ""; cout << "Название сайта: "; cin >> siteName; cout << siteName << endl; return 0; } endl; |
Используя пустые кавычки при инициализации, ми присвоюємо кожному елементу масиву значення \0. Таким образом строка будет очищена от “сміття” других программ. Даже если пользователь введет название содержащее меньшее количество символов, Наступного за назвою буде символ \0. Это позволит избежать нежелательных ошибок. У пам'яті цей рядок буде виглядати так:
До речі, якщо припустимо перезаписати 11-ю осередок цього масиву – str[11] = ' 0';
и отобразить массив на экране, то увидим только purecodecpp незважаючи на те, что в ячейках 12, 13, 14 остались храниться символы. Нульовий символ зіграє свою головну роль при виведенні на екран і все, что находится за ним не будет показано.
Поговорим о вводе строк с клавиатуры подробней. Справа в тому, что существуют определённые проблемы о которых надо знать и которые необходимо научиться решать. В следующей программе при вводе строки не всё будет так гладко, как нам хочется:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | #include <iostream> using namespace std; int main() { setlocale(LC_ALL, "rus"); char quote[128] = ""; cout << "Ваша любимая цитата из мультфильма \"Винни Пух\": "; cin >> quote; cout << quote << endl; return 0; } |
Не заморачивайтесь пока над тем, что ввод через cin необходимо производить латиницей. О том как корректно ввести кириллицу будет рассказано в отдельной статье. Тут ви бачите, что цитату мы ввели, но при выводе на экран, бачимо тільки перше слово. Это связано с тем, что мы не можем ввести нулевой символ с клавиатуры, а cin воспринимает пробел, символ новой строки и табуляцию, как конец строки. То есть в нашем случае cin прочитал только первое слово, запятую и автоматически добавил знак конца строки. Остальные введенные данные поместил во входную очередь.
Решается эта проблема просто. У C ++ є функціїget() і getline() , которые мы можем использовать вместе с cin. Они похожи, але частіше використовуєтьсяgetline(). В этой статье мы не будем рассматривать их отличие. Допишемо в нашу програму введення зgetline ():
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | #include <iostream> using namespace std; int main() { setlocale(LC_ALL, "rus"); char quote[128] = ""; cout << "Ваша любимая цитата из мультфильма \"Винни Пух\": \n"; cin.getline(quote, 128); // передаем в функцию имя массива и его размер cout << quote << endl; return 0; } |
Вы видите, что в скобках мы указали для функции два аргумента – в какой массив считать символы (имя массива) и размер этого массива – рядок 11. Результат нам підходить– всё отобразилось правильно. cin.getline() зчитує в масив всю рядок включно з пробілами і табуляції, пока не произойдет нажатие Enter или пока не будет превышен размер массива. Символ новой строки в массиве не сохранится, а заменится на нулевой символ.
В C для работы со строками существует много функций, которые мы рассмотрим в следующей статье. В ней мы поговорим о функциях, которые позволяют перезаписывать строки, объединять их, сравнивать между собой и др.
Делитесь нашими статьями с друзьями в социальных сетях – это лучшая благодарность. А при возникновении вопросов и предложений – оставляйте комментарии.
Додатково до прочитаного рекомендую подивитися відео-урок:
Підкажіть будь ласка де мені знайти момент втрачений у цій статті: “Не заморачивайтесь пока над тем, Підкажіть будь ласка де мені знайти момент втрачений у цій статті. Про те, як коректно ввести кирилицю, буде розказано в окремій статті.” Про те, як коректно ввести кирилицю, буде розказано в окремій статті.?. Про те, як коректно ввести кирилицю, буде розказано в окремій статті.?
SetConsoleOutputCP(1251); // для виведення
SetConsoleCP(1251); // для введення