Методичка С++ (Строки)

Посмотреть архив целиком

7



  1. Строки.

Строка – последовательность символов определенной длины. Существует два способа представления символьных строк.

    1. Строки как одномерный символьный массив.

Для описания строки можно использовать одномерный массив символов, если в качестве индекса применить ограниченный целый тип. В этом случае размер массива определяет длину строки. Описание строки с помощью массива выполняется двумя способами:

  1. В разделе описания переменных

VAR

S1,S2: array [1..40] of char; {Символьные строки длиной 40 байт}

S3: array [1..80] of char; { Символьная строка длиной 80 байт }

  1. В разделе описания типов, с последующим определением в разделе описания переменных

TYPE

S40 = array [1..40] of char; {Тип символьная строка длиной 40 байт}

S80 = array [1..80] of char; { Тип - символьная строка длиной 80 байт }

VAR

S1,S2: S40; {Символьные строки типа S40 }

S3: S80; {Символьная строка типа S80 }

Присвоить значение строковому массиву можно несколькими способами:

  1. С помощью символьной константы-литерала. Однако, длина константы должна точно соответствовать размеру этого массива.

VAR S: array[1..10] of char;

Begin

S:=’Пример один’;

  1. С помощью типизированной константы- массива.

CONST S: array[1..10] of char = (‘П’,’р’,’и’,’м’,’е’,’р’,’ ’,’д’,’в’,‘а’);

  1. Вводом с клавиатуры или из текстового файла. В этом случае строка водится символ за символом либо без пробелов в одну строку, либо через нажатие клавиши «ENTER» после каждого символа. Таким образом, для ввода всей строки требуется использование циклов. Если строка содержит меньше символов, чем указано при описании, следует использовать циклы с пред или пост условиями (для строк, длина строки заранее неизвестна), или счетные циклы (для строк, реальная длина которых определяется при вводе). В случае работы со строкой максимальной длины (указанной при описании) как правило используются счетные циклы. (см. пример 3.1)

Вывод символьного массива - строки можно осуществлять одним оператором write или writeln благодаря дополнительным средствам работы с символьными массивами, хотя можно использовать цикл для посимвольного вывода, как для обычных одномерных массивов.

Пример 1. Написать фрагмент программы, реализующей ввод строки символов длиной не более 80 символов и ее печать после ввода.

Programm Vvod_vivod.

TYPE

S80 = array [1..80] of char; { Тип - символьная строка длиной 80 байт }

VAR

S3: array [1..80] of char; {Символьная строка типа S80 }

N,i:integer;

begin

writeln(‘Введите строку символов не более 80 символов’);

writeln(‘Если строка менее 80 символов – в конце строки точка’);

i:=0;

repeat

i:=i+1;

read(S3[i]);

until (i=80) or (S3[i]=’.’);

readln;

if i<80 then N:=i-1

else n:=80;

writeln(‘Исходная строка символов’);

writeln(S3); {Вывод массива – строки одним оператором вывода}

writeln(‘Исходная строка символов’);

for i:=1 to N do wite(S3[i]); {Вывод массива символов в цикле}

writeln;

end.

Над строками, описанными с помощью одномерного массива, возможно выполнение двух операций:

  1. Присвоение одной строке значения другой при условии совпадения их типов, а также размеров массивов.

  2. Конкатенация строк, обозначаемая символом «+». Результатом этой операции будет новый символьный массив, число элементов которого равно сумме размеров исходных массивов, а значениями элементов – элементы этих массивов, последовательно следующие друг за другом. Однако, следует отметить, что эта операция не допускается в операторе присваивания с правой стороны, а может использоваться только в операторе вывода:

Пример 2.Использование операций над строками.

program strarr;

var st1,st2:array [1..10] of char;

st3:array [1..20] of char;i:integer;

begin

writeln('Введите значение строки символов =10символам');

for i:=1 to 10 do read(st1[i]);readln;{ввод строки в цикле}

writeln('начение = st1 ',st1); {печать строки одним оператором}

st2:=st1; {строке 2 присваивается значение строки 1}

writeln('начение = st2 ',st2);

st2:='fff''''fffff'; {строке 1 присваивается значение символьного литерала}

writeln('Результат конкатенации= ',st1 + ' ' + st2); {конкатенация строк}

end.

Работа со строками, как и с одномерными массивами осуществляется посимвольно в соответствии со значениями индексов. Рассмотрим пример обработки строк.

Пример 3. Дана строка не более 40 символов, состоящая из слов, разделенных пробелами. Написать программу удаления лишних пробелов, оставляя не более одного между словами и ни одного в начале строки.

Program Stroka;{ программа удаления 'лишних' пробелов в строке }

var

i,j,k,n:byte;

s:array [1..40] of char;

BEGIN

writeln('Введите длину исходной строки');

readln(n);

writeln('Введите исходную строку длиной ',n:3,' байт');

for i:=1 to n do read(s[i]);

readln;

writeln('Введенная строка ');

writeln(s);

j:=1; {указатель на символы переформированной строки}

k:=0; {признак "лишних пробелов" - k=0 , k=1 - нужные символы }

for i:=1 to n do

if s[i]=' ' then {если обнаружен пробел}

begin

if k=1 then {этот пробел первый}

begin

k:=0; {дальше пойдут лишние пробелы}

s[j]:=s[i];

j:=j+1;

end;

end

else begin

k:=1; {пробелов нет - идут символы}

s[j]:=s[i];

j:=j+1;

end;

for i:=j to n do

s[i]:=' ';

writeln('Преобразованная строка ');

writeln(s);

readln;

END.

    1. Переменные строкового типа.

Уже на простых примерах предыдущего раздела видно, что работа со строкой, описанной с помощью одномерного массива, довольно кропотлива. Поэтому для упрощения работы со строками был введен новый стандартный тип данных – строки. Синтаксическая диаграмма строкового типа данных представлена на рис. 1.



Целое без знака – это максимальная длина строки не более 255 байт.

Если длина не указана, то по умолчанию принимается максимальное значение = 255 символов.

Описание строки как символьного типа данных выполняется двумя способами:

  1. В разделе описания переменных

VAR

S1,S2:string[40]; {Символьные строки длиной 40 байт}

S3:string[20]; { Символьная строка длиной 80 байт }

S4:strring; ]; { Символьная строка длиной 255 байт }

  1. В разделе описания типов, с последующим определением в разделе описания переменных

TYPE

S40 = string[40]; {Тип символьная строка длиной 40 байт}

S80 = string[80]; { Тип - символьная строка длиной 80 байт }

ST = string; { Тип - символьная строка длиной 255 байт }

VAR

S1,S2: S40; {Символьные строки типа S40 }

S3:S80; {Символьная строка типа S80 }

S4:ST; { Символьная строка типа ST }

Внутреннее представление строки приведено на рис 2.



Из рис.2 видно, что во внутреннем представлении строка представляет собой одномерный массив символов размерностью от 0 до N, где N - максимальная длина строки, определенная при описании. Это означает, что реальная длина строки – N+1 (следовательно, максимально возможная длина строки – 256 байт во внутреннем представлении).

Нулевой байт содержит текущее значение длины строки в символьном виде. Обращение к нему, например S4[0], дает доступ к длине строки S4. Однако, для получения этого значения необходимо явное преобразование символьного типа в целый. Например, если i -переменная целого типа, то получить длину строки можно:

А). i:=INTEGER(S4[0]); {Явное преобразование с помощью автоопределения}

B). i:=ORD(S4[0]); {явное преобразование с помощью специальной функции}

Над переменными строкового типа определены следующие операции:

  1. Сцепления

Например

S4:=’fdc’+’ghj’ => ‘fdcghj’

S4:= S4+’vvv’ => ‘fdcghjvvv’

Если суммарной строки превышает объявленную максимальную длину, то «лишние символы» отбрасываются.

  1. Отношения: =,<>,>,<,>=,<=.

Операции отношения выполняются над строками последовательно слева направо с учетом внутренней кодировки символов до первого несовпадающего символа. Большей считается та строка, несовпадающий символ которой стоит дальше в кодовой таблице ASCII. Если длина одной строки меньше другой, то недостающие значения до длины большей строки заполняются символами CHR(0). Результатом операций отношения является значение FALSE TRUE

Допускается сравнение символов со строками, однако символы преобразуются в строки с длиной 1.

Примеры операций отношения:

S4:=’ABCD’;

S3:=’ADFH’;

C:=’L’;

S4=S3 => FALSE

S4>S3 => FALSE

S3>S4 => TRUE

S3=C => FALSE

Ввод вывод переменных строкового типа осуществляется одной операцией read (readln) или write (writeln).

При вводе за строку принимается последовательность символов до нажатия клавиши ENTER. Если длина введенной строки больше указанной максимальной длины, то лишние символы отбрасываются, а в нулевой байт записывается значение максимальной длины. В противном случае в нулевой байт записывается количество введенных символов.

При выводе строки на экран выводится количество символов в соответствии с текущей длиной, указанной в нулевом байте.

Кроме того, начальное значение переменной типа string можно задать, также с помощью символьной константы. При этом длина константы должна быть не меньше максимальной длины строки, указанной при описании.

Например

VAR ST:string[40];

CONST S:string[40]=’Типизированная константа

Begin

ST:=’Константа-литерал’;

Writeln(ST);{Печатается ’Константа-литерал’}

Writeln(S); { Печатается ’Типизированная константа’}

END.

Все остальные действия над строками и символами реализуются с помощью стандартных процедур и функций.

      1. Процедуры и функции работы со строками.

  1. Процедура DELETE(ST,INDEX,COUNT) – удаляет COUNT символов строки ST, начиная с символа с номером INDEX, где

ST - имя переменной строкового типа,

COUNT – переменная, константа и выражение целого типа, содержащая количество удаляемых символов

INDEX - переменная, константа и выражение целого типа, содержащая номер первого из удаляемых символов.

Например

Если ST = ‘dddddsssssfffff’, то после выполнения процедуры DELETE(ST,6,5)

строка станет ST = ‘dddddfffff’

  1. Процедура INSERT(ST2,ST1,INDEX) – вставляет подстроку символов ST2 в строку ST1, начиная с символа с номером INDEX, где

ST1 – переменная или константа строкового типа

ST2 - переменная строкового типа,

INDEX - переменная, константа и выражение целого типа, содержащая номер первого из удаляемых символов

например

Если ST1 = ‘dddddddddd’, ST2 = ‘аааааа’то после выполнения процедур

а) INSERT(ST1, ST2,6) результат ST = ‘dddddааааааddddd’

в) INSERT(‘PAS’, ST2,6) результат ST = ‘dddddPASddddd’

  1. Процедура STR(IBR[:W][:D],ST) преобразует значение числа в строковое представление

IBR – числовое значение целого или вещественного типа

W – ширина поля вывода преобразуемого числа, аналогично формату процедуры writeln, можно не указывать

D – количество знаков дробной части числа после десятичной точки, которое указывается только для вещественных чисел при наличии параметра W.

ST - имя переменной типа string, в которой формируется символьное представление параметра IBR.

  1. Процедура VAL(ST,IBR,COD) преобразует значение числа в строковом представлении, во внутреннее представление десятичное целого или вещественного числа.

ST – строка символов, содержащая число в символьном виде

IBR – число во внутреннем представлении, возвращаемое процедурой

COD – содержит код возвращаемой ошибки, (0 если преобразование прошло успешно, в противном случае там возвращается номер ошибочного символа

  1. Функция COPY(ST,INDEX,COUNT) – функция типа string,, возвращает копию строки ST, длиной COUNT символов, начиная с символа с номером INDEX

Например

Пусть ST = ‘qqqEEEEEEuuuuu’ тогда результатом функции

S:= COPY(ST,4,6) будет строка S => ‘EEEEEE’

  1. Функция CONCAT(ST1,ST2,…STN) – функция типа string,, возвращает строку сцепление строк параметров.

ST1,ST2,…STN – переменные или константы строкового типа, используемые для формирования строки результата.

  1. Функция LENGTH(ST) - функция типа integer, возвращает текущую длину строки S

  2. Функция POS(ST2,ST1) - функция типа integer, возвращает позицию, с которой подстрока ST2 входит в строку ST1 – первое вхождение. Если позиция вхождения не найдена – функция возвращает 0.

  3. Процедура FILLCHAR(ST,COUNT,SYM) – формирует и возвращает строку ST длиной COUNT, заполненную символами SYM

ST – переменная строкового типа

COUNT – константа или переменная целого типа

SYM – переменная или константа типа CHAR

  1. Функция UPCASE(SYM) функция типа CHAR, возвращает символ, соответствующий символу верхнего регистра для SYM, если таковой имеется, либо сам символ SYM, если для него не представлен символ верхнего регистра.

Рассмотрим, как будет выглядеть решение задачи из примера 3 с использованием строковых типов

Пример 4. Дана строка не более 40 символов, состоящая из слов, разделенных пробелами. Написать программу удаления лишних пробелов, оставляя не более одного между словами и ни одного в начале строки.

program probel;

{программа удаления «лишних» пробелов с использованием строковых функций и процедур }

type st=string[40]; {тип символьная строка}

var

str:st;

k:byte;

begin

writeln('введите строку длиной <= 40 символов');

readln(str);

writeln(' введенная строка:');

writeln(str);

k:=0;

k:=pos(' ',str); {есть ли сдвоенные пробелы?}

while k<>0 do {пока есть сдвоенные пробелы}

begin

str:=copy(str,1,k)+ copy(str,k+2,length(str));{копируем до и после пробела}

{ delete(str,k,1);}{ или удаляем лишний пробел}

k:=pos(' ',str); {есть ли сдвоенные пробелы?}

end;

writeln(' строка - результат:');

writeln(str);

end.



Случайные файлы

Файл
OR.DOC
4289.rtf
33234.rtf
71049.rtf
123579.rtf