Руководство по программированию на HTML (lecture_HTML)

Посмотреть архив целиком

HTML

1. Web-страницы. Основные понятия

Web-страница является элементарной частью Всемирной Паутины (World Wide Web, www). WWW, в свою очередь, — одна из возможностей компьютерной сети Internet, связывающей компьютеры по всему миру.

Вся информация www хранится в виде отдельных документов. В основе каждого такого документа лежит текст, который может быть оформлен различными шрифтами, стилями и т. п. В тексте могут быть помещены иллюстрации, таблицы, видео-клипы, также возможно добавление фоновой звуковой дорожки. Основное свойство документов во Всемирной Паутине — наличие ссылок на другие документы, находящиеся в Сети. Такие ссылки называются гиперссылками (hyperlink), они позволяют при просмотре быстро переходить от одного документа к другому, и тем самым связывают все документы в единое целое. Документы, о которых идёт речь, называются web-страницами. Содержимое web-страниц часто называют гипертекстом.

Набор страниц, объединённых общей тематикой, называется сайтом (web site). Обычно весь сайт целиком хранится на одном компьютере сети, называемом web-сервером. Довольно часто серверы содержат несколько сайтов.

У каждого объекта, к которому можно получить доступ через Internet (в частности, у сайтов и отдельных web-страниц) имеется свой адрес в сети, который называется иначе унифицированным адресом ресурса (Uniform Resource Locator, URL).

Рассмотрим пример адреса для web-сайта: http://www.uni-vologda.ac.ru (сайт ВГПУ). Первая часть адреса (“http://”) — название протокола, по которому нужно производить передачу данных по Сети. Протокол — набор правил, которые определяют, в каком виде данные должны передаваться по сети. Для разных видов данных используются разные протоколы. В случае web-страниц применяется протокол передачи гипертекста (HyperText Tranfer Protocol, HTTP). Для передачи произвольных файлов по Сети используется протокол передачи файлов (File Transfer Protocol, FTP). Существуют и другие протоколы (Gopher, Telnet и т. д.).

За именем протокола в адресе следует собственно адрес, который лучше читать справа налево. Часть “ru” означает, что сайт находится в России, она называется доменом (группа сайтов) первого уровня. Домен 1-ого уровня может быть географическим (ru — Россия, us — США, uk — Великобритания, ger — Германия, ua — Украина и т. п.) или тематическими (com — коммерческий сайт, edu — образование, gov — правительство, net — сетевые службы, mil — военное дело и оборона и т. п.). Внутри домена первого уровня находится домен второго уровня, в нашем случае — “ac” это значит, что сайт имеет отношение к образованию и науке. В принципе возможны домены третьего и более высоких уровней. Слева в адресе содержится название самого сайта (“uni-vologda”). Иногда, для того чтобы подчеркнуть то, что адрес относится к Всемирной Паутине, добавляют часть “www”.

Для просмотра web-страниц используются специальные программы, называемые браузерами (web browser). Они позволяют загружать из Сети для просмотра страницы с заданным адресом и переходить от документа к другому по гиперссылкам. Наиболее известными являются браузеры Netscape Navigator фирмы Netscape и Internet Explorer фирмы Microsoft.

2. Понятие языка HTML

Наша цель состоит в том, чтобы научиться создавать собственные страницы для WWW. Для этого придётся познакомиться с правилами, в соответствии с которыми страницы хранятся на диске компьютера. Любая страница представлена в виде отдельного текстового файла, который можно создать любым текстовым редактором. Так как страница может содержать не только текст, но и множество других элементов (шрифтовое оформление текста, иллюстрации и т. п.), то в текст встраиваются специальные управляющие конструкции, называемые тегами. Весь набор правил, по которым нужно создавать файл с web-страницей и записывать отдельные теги, называется языком разметки гипертекста (HyperText Markup Language, HTML). Браузеры при открытии файла в формате HTML способны расшифровать теги и показать страницу в своём окне так, как она была задумана создателем. В операционной системе Windows файлы web страниц должны иметь расширения “htm” или “html”. При обучении правилам HTML нет необходимости помещать наши страницы на действующий сайт в Internet, достаточно хранить их в виде файлов на конкретной рабочей станции или на сервере локальной сети.

3. Структура файла в формате HTML

В первую очередь нам потребуется создать файл с расширением “htm” или “html” и открыть его для редактирования в текстовом редакторе (работая под Windows, можно использовать стандартную программу “Блокнот”).

Текст для HTML-документа набирается в том виде, в котором его должен показать браузер, а при выделения фрагментов, которые предназначены для разметки документа (тегов), используются угловые скобки (знаки “больше” и “меньше”), например: <BODY>.

Любой документ HTML начинается с открывающего тега <HTML> и заканчивается соответствующим ему закрывающим тегом html>. Закрывающий тег отличается от закрывающего наличием косой черты перед названием тега. В языке HTML нет различий между большими и малыми буквами при записи тегов, однако принято записывать открывающий тег большими буквами, а закрывающий — малыми. Часть документа, которая находится в пределах от открывающего до соответствующего ему закрывающего тега, называется контейнером (to contain — содержать что-либо). Теги, у которых есть закрывающий и открывающий варианты записи называются парными, а те, которые используются только в одном виде (например, тег <BR>), называются непарными. Весь файл web-страницы — это по сути дела один большой контейнер HTML (так как начинается с <HTML> и заканчивается html>).

Внутри контейнера HTML последовательно записываются два контейнера:

  1. <HEAD> . . . head> (заголовок документа). Внутри этого контейнера записываются параметры, общие для всей страницы. Для примера можно поместить сюда контейнер <TITLE>, позволяющий поместить текст для отображения в заголовке окна браузера.

  2. <BODY> . . . body> (тело документа). Этот контейнер содержит всё то, что должен показать браузер внутри своего окна при открытии документа. Если документ содержит только текст, то этот текст нужно записывать именно здесь, если есть другие элементы (графика, таблицы, ссылки и т. д.), то они вставляются в текст с помощью тегов, которые будут рассмотрены позже.

Рассмотрим простейший пример текста, который может быть использован в качестве HTML-документа:

</span></font><font face="Courier New, monospace">Самая</font><font face="Courier New, monospace"><span lang="en-US"> </span></font><font face="Courier New, monospace">простая</font><font face="Courier New, monospace"><span lang="en-US"> web-</span></font><font face="Courier New, monospace">страница</font><font face="Courier New, monospace"><span lang="en-US">

<BODY>

То, что вы сейчас читаете в окне браузера, записано в контейнере BODY внутри HTML-файла.

body>

html>

4. Способы оформления текста в HTML

В первую очередь, отметим несколько особенностей поведения большинства браузеров при отображении текста, набранного внутри контейнера BODY.

  1. Пробелы между словами в количестве более одного заменяются одним пробелом

  2. Символы перехода на новую строку игнорируются, а точнее заменяются пробелом. Браузер выполняет перевод строки автоматически в тот момент, когда строчка достигает правого края окна.

  3. Если есть необходимость вставить в каком-либо месте в тексте принудительный перевод на новую строку, то можно использовать непарный тег <BR>. Он разрывает текущую строку, а текст, следующий за этим местом в HTML-файле, продолжает с новой строки.

  4. Кроме тега разрыва строки имеется тег начала нового абзаца, <P> (от слова paragraph — абзац). Отличие его от <BR> состоит в том, что тег абзаца кроме разрыва строки вставляет новую пустую строку. Обычно он используется как непарный, хотя не запрещено ставить в конце абзаца закрывающий тег p>.

  5. Если нужно сохранить все пробелы и символы перевода строки, которые записаны в HTML-файле, то соответствующую часть текста можно поместить в контейнер <PRE> . . . pre>.

4.1. Логические стили для оформления текста

При отображении текста часто бывает необходимо некоторые фрагменты выделить особым образом. В тексте часто встречаются заголовки разной степени важности, адреса электронной почты и узлов web, верхние и нижние индексы, цитаты и т. п. Чтобы выделять эти фрагменты, их нужно помещать в определённые контейнеры, каждый из которых предназначен для одной определённой цели, или, другими словами, определяет логический стиль. Один и тот же логический стиль может отображаться на разных браузерах по-разному. Ниже перечислены некоторые стили.

  1. Контейнер <H1> . . . h1>. Сюда помещают те фразы, которые служат заголовками первого уровня, то есть, наиболее важные заголовки (например названия глав в книге). Внешне они чаще всего выглядят как текст увеличенного размера и полужирного начертания. Кроме этого контейнера есть и контейнеры H2, H3, ... H6, позволяющие использовать ещё пять уровней заголовков.

  2. <ADDRESS> . . . address>. Этот контейнер позволяет особо оформить адрес (почтовый, адрес сайта, электронной почты и т. д.).

  3. Контейнеры STRONG (усиленное выделение) и EM (от англ. emphasis — акцент). Сюда помещают текст, содержащий важные мысли, термины и т. п. Стиль STRONG обычно отображается браузерами с использованием полужирного начертания, а EM — курсивом.

  4. Для записи текстов программ и текста, введённого с клавиатуры, можно использовать три контейнера: CODE (код программы), SAMP (sample — пример) и KBD (keyboard — клавиатура). Все они могут отображаться по-разному, но общее у них — использование моноширинного шрифта (например, Courier), все буквы в котором имеют одинаковую ширину. Такой шрифт позволяет разным строчкам не смещаться относительно друг друга, символы с одинаковым номером в строке всегда находятся на одной вертикальной прямой.

  5. Возможно выделение текста с помощью уменьшенного и увеличенного шрифтов, для этого применяются контейнеры BIG и SMALL.

  6. Если фрагмент текста должен быть показан как верхний индекс, то для его выделения используется контейнер SUP, а для нижнего индекса — SUB. Например, для того, чтобы записать y=x2, потребуется в HTML-текст поместить такую строчку: y=x<SUP>2sup>.

4.2. Физические стили

В отличие от логических, эти стили не оформляют текст по его назначению, а указывают внешний вид символов, отображаемых браузером:

  1. Курсив. Текст, который должен быть выделен курсивом, помещается в контейнер <I>...i>.

  2. Полужирный — контейнер <B>...b>.

  3. Подчёркнутый — <U>...u>.

  4. Зачёркнутый....

  5. Шрифт пишущей машинки (моноширинный) — <TT>...tt>.

Если требуется применить к тексту сразу два физических стиля, то можно один контейнер вложить в другой, например: <B><I>Полужирный курсивi>b>.

4.3. Горизонтальное выравнивание текста

По умолчанию браузеры выравнивают текст по левому краю окна. Иногда, тем не менее, требуется поместить фрагмент текста по центру или по правому краю окна. В первом случае для центрирования текста (или других объектов) достаточно поместить фрагмент внутрь контейнера CENTER.

Если нужно указать левое или правое выравнивание, то можно использовать дополнительные возможности тега <P>, например: <P ALIGN=RIGHT>Правое выравниваниеp>. Здесь дополнительный элемент ALIGN тега P называется атрибутом, а RIGHTзначением атрибута. Вообще говоря, теги могут содержать несколько атрибутов, разделённых пробелами, бывают атрибуты без значений (например: <FRAME SRC="f1.html" NORESIZE>, в этом теге есть атрибут NORESIZE, для которого не требуется значение).

Кроме значения RIGHT у атрибута ALIGN есть, очевидно, и значение LEFT. Установленное в теге <P> выравнивание будет действовать на протяжении всего абзаца, до тех пор, пока не встретится тег p> или следующий тег <P>.

Атрибут ALIGN поддерживается не только для тега абзаца, но и для тегов всех шести заголовков (<H1>, ... <H6>), в результате заголовок будет выровнен по вашему желанию. Его действие распространяется только до соответствующего закрывающего тега (h1>, ... h6>).

4.4. Управление размером шрифта

На нашем уровне владения языком HTML возможно управление размером букв только с использованием заголовков разного уровня, однако существует возможность указывать размер шрифта явным образом.

В HTML размер текста задаётся целым числом от 1 до 7 (1 — самый мелкий, 7 — самый крупный). По умолчанию основной текст страницы имеет размер 3. Для того чтобы задать другой основной размер, нужно использовать тег <BASEFONT>. В атрибуте SIZE этого тега указывается новый размер основного шрифта. Такой размер будет установлен для текста, находящегося после тега <BASEFONT>. Пример: <BASEFONT SIZE=5>Это текст размера 5.

При необходимости можно для части текста заказать другой размер шрифта с помощью тега <FONT> у которого также есть атрибут SIZE. Этот тег может использоваться и как парный (тогда размер будет применён до закрывающего тега font>), и как непарный (размер применяется до следующего тега <FONT> или <BASEFONT>).

Отличие тега <FONT> от <BASEFONT> состоит в следующем: в атрибуте SIZE тега <FONT> можно указывать увеличение или уменьшение размера шрифта относительно размера основного текста страницы. Для этого используются знаки «+» и «-». Например, запись <FONT SIZE=+2> значит «установить размер шрифта на 2 больше основного», а <FONT SIZE=-1> означает «на 1 меньше».

4.5. Управление цветом и гарнитурой шрифта

Кроме размера шрифта тег <FONT> позволяет задать цвет символов и выбрать гарнитуру (то есть способ начертания букв из числа установленных в операционной системе вариантов). Для этого используются атрибуты COLOR и FACE.

В качестве значения для атрибута COLOR можно указывать:

  1. Одно из стандартных названий цвета в кавычках, а именно: BLACK, NAVY, SILVER, BLUE, MAROON, PURPLE, RED, FUCHSIA, GREEN, TEAL, LIME, AQUA, OLIVE, GRAY, YELLOW, WHITE;

  2. Числовой код цвета, состоящий из интенсивностей трёх цветов: красного, зелёного и синего. Он задаётся в следующем виде: COLOR="#RRGGBB", где вместо букв RR, GG и BB нужно записывать количество красной, зелёной и синей «краски» соответственно. Эти количества записываются в виде шестнадцатеричных чисел от 00 до FF (в десятичной системе это интервал от 0 до 255). Например, если нужно получить оранжевый цвет текста, можно указать COLOR="#FF8000".

В качестве значений для атрибута FACE в кавычках указывают название шрифта, например: FACE="Arial Cyr".

Пример использования известных нам атрибутов тега <FONT>:

... ТЕКСТ ... font>.

4.6. Управление разбиением текста на строки

Как нам уже известно, браузер автоматически переносит текст на новую строку, как только текст достигнет правого края окна. Для того чтобы «досрочно» сделать перенос строки мы можем использовать теги <BR> или <P>.

В некоторых случаях предпочтительнее позволить тексту выйти за пределы видимой части окна, чем позволить ему оказаться в разных строках. Чтобы запретить автоматический переход на новую строку нужно поместить соответствующий фрагмент текста в контейнер NOBR. Внутри этого контейнера можно указать те места, в которых всё-таки можно перейти на новую строку, это делается с помощью тега <WBR>.

Пример использования <NOBR> и <WBR>:

<NOBR>Этот текст не может быть разбит браузером на строки автоматически. Мы разрешим ему сделать перенос только после этого предложения. <WBR> А этот фрагмент также запрещено разрыватьnobr>.

4.7. Вставка специальных символов в документ HTML

Некоторые символы невозможно показать в окне браузера, просто набрав их в текстовом редакторе. К ним относятся, например знаки «<» и «>», поскольку их браузер считает символами начала и конца тегов. Если всё-таки возникла необходимость показать такие специальные символы, то их заменяют такой последовательностью: сначала пишут знак амперсанда (&), затем буквенное обозначение спецсимвола, а в конце — точку с запятой. Для знаков «<» и «>» используются буквенные обозначения «lt» и «gt» (less than — больше, чем ...; greater than — больше, чем ... ). Например если нужно показать в браузере «A>B», то в тексте HTML будем записывать: «A&lt;B».

Понятно, что символ «&» также невозможно записать напрямую, вместо этого записывают «&amp;». Для записи двойной кавычки используется код «&quot». Существует много специальных символов, которые невозможно набрать с клавиатуры (в частности, буквы из других алфавитов), их коды можно найти в справочной литературе.

5. Списки

Довольно часто в тексте html-документа приходится перечислять какие-либо объекты или давать определения понятий. В таких случаях можно пользоваться средствами HTML для организации списков. Списки существуют не только в языке HTML, но и во многих текстовых редакторах. В HTML имеется 3 вида списков:

1. Нумерованный список. Каждый элемент такого списка имеет номер, который браузер проставит автоматически. По умолчанию первый элемент списка имеет номер 1, второй — 2 и т.д. Для вставки нумерованного списка нам потребуется контейнер OL (ordered list — нумерованный список), внутри которого можно перечислять элементы списка. Перед тем как записывать очередной элемент списка, нужно вставлять непарный тег <LI> (list item — элемент списка). Общая структура списка имеет такой вид:

<OL>

<LI>Первый элемент

<LI>Второй элемент

<LI>Последний элемент

ol>

Простейший пример нумерованного списка на web-странице можно найти в файле Lists\OL1.html.

Для нумерованных списков возможна настройка способа нумерации элементов. Кроме арабских цифр можно использовать римские, а также большие или малые латинские буквы. Для указания способа нумерации используется атрибут TYPE тега

    . Этот атрибут может принимать одно из четырёх значений: 1 — арабские цифры, i или I — римские цифры, a — малые латинские буквы, A — большие латинские буквы. Пример использования атрибута TYPE имеется в файле Lists\OL2.html.

    При необходимости можно начинать нумерацию элементов списка не с 1, а с произвольного номера. Чтобы указать начальный номер в списке, используют атрибут START тега

      , например:
        (первый номер — 5). Этот атрибут работает только в случае нумерации арабскими цифрами.

        2. Маркированный список. Иногда нумерация бывает не важна, но выделить для читателя отдельные элементы списка необходимо. В этом случае перед каждым элементом списка ставится небольшой значок (маркер), обычно это круг, квадрат и т. п. Такие списки создаются с помощью контейнера UL (unordered list — ненумерованный список), внутри которого также как для нумерованных списков перечисляются элементы с помощью тегов <LI>.

        Тип маркера указывается в атрибуте TYPE тега

          . Возможно 3 вида маркеров: DISC — круг, CIRCLE — окружность, SQUARE — квадрат. При необходимости можно заказать для отдельного элемента списка маркер, отличающийся от других. Для этого атрибут TYPE нужно применять в теге <LI> перед соответствующим элементом списка.

          Примеры маркированных списков находятся в файле Lists\UL.html.

          3. Списки определений. Этот вариант применяется в том случае, когда каждый элемент списка состоит из двух частей: термина (понятия и т. п.) и его определения (расшифровки). Для вставки списка определений используется контейнер DL (definition list — список определений). Каждый элемент записывается с использованием двух тегов: <DT>Термин<DD>Его определение. Пример списка определений можно найти в файле Lists\DL.html.

          6. Гипертекстовые ссылки

          Главная особенность web-страниц состоит в том, что любая из них может позволить перейти к другой странице, находящейся на том же компьютере или в Интернет. Выглядит это следующим образом: фрагмент документа (текст, картинка или другой объект) выделяется особым образом; при просмотре страницы можно, щёлкнув мышью по этому фрагменту заставить браузер загрузить другую страницу, адрес которой записывается в тексте HTML-документа. По этой причине содержимое страниц называется гипертекстом.

          Для выделения фрагмента, являющегося ссылкой, используется контейнер <A> (от слова anchor — якорь). Наиболее важный атрибут тега <A> — это HREF, в качестве значения которого записывается адрес страницы, на которую нужно перейти. Ниже приведён пример вставки гиперссылки:

          <A HREF="http://uni-vologda.ac.ru">Щёлкните сюда, чтобы перейти на главную страницу web-сайта ВГПУa>

          В качестве адреса в атрибуте HREF записывается либо полный URL сайта или страницы, либо имя файла, содержащего страницу, если она лежит на том же компьютере, что и исходная. Если страница лежит на том же компьютере, в том же каталоге, что и просматриваемая, то в HREF достаточно указать имя файла. Если же она лежит в другом каталоге, то вместо имени протокола пишут «file://», а затем — полный путь к файлу и его имя.

          Примеры: HREF="main.html", HREF="file://c:\WebPages\Book\contents.htm".

          Иногда страницы могут оказаться довольно большими, и для поиска нужной информации потребуется много времени. В таких случаях разумно делать ссылки в пределах одного документа. Пусть, например, в формате HTML опубликована целая книга, тогда её содержание можно выполнить в виде ссылок, щёлкнув по нужной ссылке можно быстро перейти к началу интересующей нас главы или части книги.

          Чтобы сделать ссылку в пределах одного документа потребуется два шага:


Случайные файлы

Файл
61104.rtf
90144.rtf
168307.rtf
152964.rtf
30329-1.rtf




Чтобы не видеть здесь видео-рекламу достаточно стать зарегистрированным пользователем.
Чтобы не видеть никакую рекламу на сайте, нужно стать VIP-пользователем.
Это можно сделать совершенно бесплатно. Читайте подробности тут.