Алфавит языка — это тот набор знаков (символов), который допустим в данном языке. Такое определение справедливо и для языка человека, и для языков программирования.
В языке С++ алфавит можно подразделить на следующие группы знаков:
прописные и строчные латинские буквы (A, B, ..., Z, a, b, ..., z);
арабские цифры (0, 1, 2, 3, 4, 5, 6, 7, 8, 9);
специальные знаки: " , { } | [ ] ( ) + - / % \ ; ' . : ? < = > _ ! & * # ~ ^
пробельные символы — это символы пробела, табуляции, перехода на новую строку.
Идентификатор — это имя какого-либо объекта программы. Например, имена дают переменным, функциям, классам и т.д. Имя может состоять из латинских букв, цифр и символа _ (символ подчеркивания). Начинаться имя может с буквы или символа подчеркивания, но не с цифры. Важно учитывать, что прописные и строчные латинские буквы, используемые в идентификаторах, считаются различными (это требование является общим для всех С-подобных языков: С, С++, С#, Java, Perl и многих других. В таких же языках, как Fortran, Pascal, Basic не делается различия в именах между прописными и строчными латинскими буквами).
Пример допустимых идентификаторов:
alfa Alfa ALFA x _x a25 i_tek
Обратите внимание: здесь alfa, Alfa и ALFA — разные имена.
Имена, подобные приведённым ниже, ни в коем случае нельзя использовать в качестве идентификаторов:
25a (начинается с цифры);
Альфа (кириллица не допустима).
Общепринятые рекомендации по использованию имён:
желательно, чтобы имя объекта было осмысленным;
в качестве имён констант используйте имена, состоящие из прописных латинских букв, например: PI, GAMMA;
не используйте имена, начинающиеся с символа подчеркивания, так как такие имена часто используют разработчики компиляторов для своих целей;
чем больше область видимости имени, тем более выразительным и длинным должно быть имя. Короткие однобуквенные или двухбуквенные имена допустимы только внутри небольших блоков программы, внутри коротких функций пользователя.
Длина имени в большинстве случаев не ограничена, но на длину внешних имён (имён библиотек, функций) может накладывать ограничение операционная система.
Ключевые (зарезервированные) слова — это слова, которые можно использовать в программе только по их прямому назначению, т.е. эти имена нельзя использовать для обозначения, например, своих переменных.
В языке С++ имеется 63 ключевых слова. Все они приведены в таблице:
asm |
do |
if |
return |
typedef |
auto |
double |
inline |
short |
typeid |
bool |
dynamic_cast |
int |
signed |
typename |
break |
else |
long |
sizeof |
union |
case |
enum |
mutable |
static |
unsigned |
catch |
explicit |
namespace |
static_cast |
using |
char |
export |
new |
struct |
virtual |
class |
extern |
operator |
switch |
void |
const |
false |
private |
template |
volatile |
const_cast |
float |
protected |
this |
wchar_t |
continue |
for |
public |
throw |
while |
default |
friend |
register |
true |
|
delete |
goto |
reinterpret_cast |
try |
|
Нет смысла заучивать сразу все ключевые слова языка С++. Лучше по мере изучения языка запоминать и ключевые слова. А пока достаточно знать несколько наиболее употребительных ключевых слов, которые начнем использовать в ближайшее время, например:
for, do, if, else, return, int, double.
Константы — это неизменяемые величины. В языке C++ имеется пять типов констант: целые, вещественные, символьные, строковые и булевые.
1. Целые константы. Правила языка допускают использование трёх видов целых констант: десятичных, шестнадцатеричных и восьмеричных. Основание определяется префиксом в записи константы. Для десятичных констант префикс не нужен.
Десятичное целое — это последовательность десятичных цифр, начинающаяся не с нуля (если это не число нуль), например:
100 25 0 2009
Восьмеричное целое — это последовательность цифр, начинающаяся с 0 и не содержащая десятичных цифр старше 7, например:
016 — восьмеричное представление десятичного целого 14;
025 — восьмеричное представление десятичного целого 21.
Шестнадцатеричное целое — это последовательность шестнадцатеричных цифр (0, 1,…, 9, А, B, С, D, Е, F), перед которой записаны символы 0х или 0Х, например:
0х25 — шестнадцатеричное представление десятичного целого 37;
0ХFF — шестнадцатеричное представление десятичного целого 255.
2.Вещественные константы. Для представления вещественных (нецелых) чисел используются константы, представляемые в памяти компьютера в форме с плавающей точкой. Каждая вещественная константа состоит из следующих частей: целая часть (десятичная целая константа); десятичная точка; дробная часть (десятичная целая константа); признак показателя "е" или "Е"; показатель десятичной степени (десятичная целая константа, возможно, со знаком). При записи констант с плавающей точкой могут опускаться целая или дробная часть (но не одновременно); десятичная точка или символ экспоненты с показателем степени (но не одновременно). Примеры констант с плавающей точкой:
125. 3.14159265 1.0е-5 .314159Е25 0.0
3.Символы, или символьные константы. Для изображения отдельных знаков, имеющих индивидуальные внутренние коды, используются символьные константы. Каждая символьная константа — это лексема, которая состоит из изображения символа и ограничивающих апострофов. Например: 'A', 'a', '5', '?', и т.д.
Внутри апострофов можно записать любой символ, изображаемый на дисплее или принтере в текстовом режиме. Однако в компьютере используются и коды, не имеющие графического представления на экране дисплея, клавиатуре или принтере. Примерами таких кодов служит код перехода курсора дисплея на новую строку или код возврата каретки (возврат курсора к началу текущей строки). Для изображения в программе соответствующих символьных констант используются комбинации из нескольких символов, имеющих графическое представление. Каждая такая комбинация начинается с символа '\' (обратная косая черта — back slash). Такие наборы литер, начинающиеся с символа '\', в литературе по языкам C и С++ называют управляющими последовательностями. Ниже приводится их список:
'\n' — перевод строки;
'\t' — горизонтальная табуляция;
'\r' — возврат каретки (курсора) к началу строки;
'\\' — обратная косая черта \;
'\'' — апостроф (одиночная кавычка);
'\"' — кавычка (символ двойной кавычки);
'\0' — нулевой символ;
'\a' — сигнал-звонок;
'\b' — возврат на одну позицию (на один символ);
'\f' — перевод (прогон) страницы;
'\v' — вертикальная табуляция;
'\?' — знак вопроса.
Обратите внимание на то, что перечисленные константы изображаются двумя или более литерами, а обозначают они одну символьную константу, имеющую индивидуальный двоичный код. Управляющие последовательности являются частным случаем эскейп-последовательностей (ESCAPE-sequence), к которым также относятся лексемы вида '\ddd' либо '\xhh' или '\Xhh', где
'\ddd' — восьмеричное представление любой символьной константы. Здесь d — восьмеричная цифра (от 0 до 7). Например, '\017' или '\233'.
'\xhh' или '\Xhh' — шестнадцатеричное представление любой символьной константы. Здесь h — шестнадцатеричная цифра (от 0 до F). Например, '\x0b', '\x1A', и т.д.
Символьная константа (символ) имеет целый тип, т.е. символы можно использовать в качестве целочисленных операндов в выражениях.
4.Строки, или строковые константы. Строки вообще-то не относятся к константам языка С++, а представляют собой отдельный тип его лексем. Для них в литературе используется еще одно название: «строковые литералы». Строковая константа определяется как последовательность символов (см. выше символьные константы), заключенная в двойные кавычки (не в апострофы!):
"Это строка"
Среди символов строки могут быть эскейп-последовательности, т.е. сочетания знаков, соответствующие неизображаемым символам, или символам, задаваемым их внутренними кодами. В этом случае, как и в представлениях отдельных символьных констант, их изображения начинаются с обратной косой черты '\':
"\n Текст \n разместится \n на 3-х строках"
Представления строковых констант в памяти компьютера подчиняются следующим правилам. Все символы строки размещаются подряд, и каждый символ (в том числе представленный эскейп-последовательностью) занимает ровно 1 байт. В конце записи строковой константы компилятор помещает символ '\0'.
Таким образом, количество байтов, выделяемое в памяти компьютера для представления значения строки, на единицу больше, чем число символов в записи этой строковой константы:
"Строка в 18 байт."
Внимание. При работе с символьной информацией важно помнить, что длина символьной константы, например, 'A' равна 1 байту, а длина строки "A" равна 2 байтам, т.к. строка заканчивается нуль-символом ('\0').
5.Булевые константы. Имеется всего два значения: true — истина и false — ложь.
Комментарий — это последовательность любых знаков (символов), которая используется в тексте программы для её пояснения. Обычно в тексте программы делают вводный комментарий к программе в целом (её назначение, автор, дата создание и т.д.), а далее дают комментарии к отдельным фрагментам текста программы, смысл которых не является очевидным. Важно объяснить не только то, что делается, а для чего это делается. Комментарии важны в любом случае: делается ли программа для себя, или с ней будут работать другие люди.
Комментарии игнорируются компилятором языка программирования, они нужны только для человека. В языке С++ имеется два вида комментариев: однострочные и многострочные.
Однострочный комментарий начинается с символов // (две косые черты). Всё, что записано после этих символов и до конца строки, считается комментарием. Например:
// Это текст комментария
Многострочный комментарий начинается парой символов /* (косая черта и звёздочка) и заканчивается символами */ (звёздочка и косая черта). Текст такого комментария может занимать одну или несколько строк. Всё, что находится между знаками /* и */ , считается комментарием. Например:
/* Это мой большой
многострочный комментарий */
|
|
|