ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ
УНИВЕРСИТЕТ»
А.В. Сычев
WЕВ-ТЕХНОЛОГИИ
Часть 1
Учебное пособие
Издательско-полиграфический центр
Воронежского государственного университета
Воронеж 2009
Стр.1
Глава 1. ВВЕДЕНИЕ В ВЕБ-ТЕХНОЛОГИИ: СТРУКТУРА
И ПРИНЦИПЫ ВЕБ
1.1. Предмет курса
Предметом данного курса являются технологии глобальной сети World
Wide Web (сокращенно WWW или просто Web). На русском языке
распространенным вариантом является название «Веб».
В частности, в рамках курса будут рассмотрены следующие вопросы:
1) структура и принципы Веб (базовые понятия, архитектура, стандарты
и протоколы);
2) технологии сети Веб (языки разметки и программирования вебстраниц,
инструменты разработки и управления веб-контента и приложений
для Веб, средства интеграции веб-контента и приложений в Веб).
Сеть Веб представляет собой глобальное информационное пространство, основанное
на физической инфраструктуре Интернета и протоколе передачи данных
HTTP. Зачастую, говоря об Интернете, подразумевают именно сеть Веб.
1.2. Что такое Интернет?
Поскольку физической основой сети Веб является сеть Интернет, то для
более глубокого понимания многих вопросов данного курса потребуется
кратко ознакомиться со структурой и протоколами Интернета.
Что же такое Интернет?
По сути, это самая большая в мире сеть, не имеющая единого центра
управления, но работающая по единым правилам и предоставляющая своим
пользователям единый набор услуг. Интернет можно рассматривать как
«сеть сетей», каждая из которых управляется независимым оператором –
поставщиком услуг Интернета (ISP, Internet Service Provider).
С точки зрения пользователей Интернет представляет собой набор информационных
ресурсов, рассредоточенных по различным сетям, включая
ISP-сети, корпоративные сети, сети и отдельные компьютеры домашних
пользователей. Каждый отдельный компьютер в данной сети называется
хостом (от английского термина host).
Сегодняшний Интернет обязан своему появлению объединенной сети
ARPANET, которая начиналась как скромный эксперимент в новой тогда
технологии коммутации пакетов (табл. 1.1). Сеть ARPANET была
развернута в 1969 г. и состояла поначалу всего из четырех узлов с
коммутацией пакетов, используемых для взаимодействия горстки хостов и
терминалов. Первые линии связи, соединявшие узлы, работали на скорости
всего 50 Кбит/с. Сеть ARPANET финансировалась управлением перспективного
планирования научно-исследовательских работ ARPA (Advanced
Research Projects Agency) Министерства обороны США и предназначалась
для изучения технологии и протоколов коммутации пакетов, которые могли
бы использоваться для кооперативных распределенных вычислений.
3
Стр.3
можность проводить разработку, тестирование и модификацию каждого
отдельного уровня независимо от других уровней. Иерархическая декомпозиция
позволяет, перемещаясь в направлении от более низких к более
высоким уровням переходить к более простому представлению решаемой
задачи.
Специфика многоуровневого представления сетевого взаимодействия
состоит в том, что в процессе обмена сообщениями участвуют как минимум
две стороны, для которых необходимо обеспечить согласованную работу
двух иерархий аппаратно-программных средств. Каждый из уровней
должен поддерживать интерфейс с выше- и нижележащими уровнями
собственной иерархии средств и интерфейс со средствами взаимодействия
другой стороны на том же уровне иерархии. Данный тип интерфейса
называется протоколом (рис. 1.2).
Узел А
Протокол 4А – 4Б
4А
Протокол 3А – 3Б
3А
Протокол 2А – 2Б
2А
Протокол 1А – 1Б
1А
Протокол 1А - 1Б
1Б
Рис. 1.2. Организация взаимодействия между уровнями иерархии при иерархической
декомпозиции в сети Интернет
Иерархически организованный набор протоколов, достаточный для
организации взаимодействия узлов в сети, называется стеком протоколов.
В начале 80-х годов ХХ века международные организации по
стандартизации ISO (International Organization for Standardization), ITU (International
Telecommunications Union) и другие разработали стандартную
модель взаимодействия открытых систем OSI (Open System Interconnection).
Назначение данной модели состоит в обобщенном представлении средств
сетевого взаимодействия. Ее также можно рассматривать в качестве
универсального языка сетевых специалистов (справочной модели).
Поскольку сеть – это соединение разнородного оборудования,
актуальной является проблема совместимости, что в свою очередь, требует
6
Протокол 2А - 2Б
2Б
Протокол 3А - 3Б
3Б
Интерфейс 2Б - 2Б
Интерфейс 1Б - 2Б
Интерфейс 2Б – 2Б
Интерфейс 1Б – 2Б
Узел Б
Протокол 4А - 4Б
4Б
Интерфейс 3Б - 4Б
Интерфейс 3Б – 4Б
Стр.6
согласования всеми производителями общепринятых стандартов.
Открытой является система, построенная в соответствии с открытыми
спецификациями.
Спецификация представляет собой формализованное описание аппаратных
(программных) компонентов, способов их функционирования, взаимодействия
с другими компонентами, условий эксплуатации, особых характеристик.
Под открытыми спецификациями понимаются опубликованные,
общедоступные спецификации, соответствующие стандартам и
принятые в результате достижения согласия после всестороннего обсуждения
всеми заинтересованными сторонами. Использование открытых спецификаций
при разработке систем позволяет третьим сторонам разрабатывать
для этих систем аппаратно-программные средства расширения и
модификации, а также создавать программно-аппаратные комплексы из
продуктов разных производителей.
Если две сети построены с соблюдением принципов открытости, это
дает следующие преимущества:
- возможность построения сети из аппаратных и программных средств
различных производителей, придерживающихся стандарта;
- безболезненная замена отдельных компонентов сети другими, более
совершенными;
- легкость сопряжения одной сети с другой.
В рамках модели OSI средства взаимодействия делятся на семь уровней:
прикладной, представления, сеансовый, транспортный, сетевой, канальный
и физический. В распоряжение программистов предоставляется прикладной
программный интерфейс, позволяющий обращаться с запросами к самому
верхнему уровню, а именно, – уровню приложений.
Сеть Интернет строилась в полном соответствии с принципами открытых
систем. В разработке стандартов этой сети принимали участие тысячи
специалистов-пользователей сети из вузов, научных организаций и компаний.
Результат работы по стандартизации воплощается в документах RFC.
RFC (англ. Request for Comments) – документ из серии пронумерованных
информационных документов Интернета, содержащих технические спецификации
и Стандарты, широко применяемые во Всемирной сети. В
настоящее время первичной публикацией документов RFC занимается
IETF под эгидой открытой организации Общество Интернета (ISOC).
Правами на RFC обладает именно Общество Интернет. Формат RFC
появился в 1969 г. при обсуждении проекта ARPANET. Первые RFC
7
Стр.7
распространялись в печатном виде на бумаге в виде обычных писем, но
уже с декабря 1969 г., когда заработали первые сегменты ARPANET,
документы начали распространяться в электронном виде. В таблице 1.2
приведены некоторые из наиболее известных документов RFC.
Т а б л и ц а 1.2
Номер RFC
RFC 768
RFC 791
RFC 793
RFC 822
RFC 959
RFC 1034
RFC 1035
RFC 1591
RFC 1738
RFC 1939
RFC 2026
RFC 2045
RFC 2231
RFC 2616
RFC 2822
RFC 3501
Примеры популярных RFC-документов
Тема
UDP
IP
TCP
Формат электронной почты, заменен RFC 2822
FTP
DNS — концепция
DNS — внедрение
Структура доменных имен
URL
Протокол POP версии 3 (POP3)
Процесс стандартизации в Интернете
MIME
Кодировка символов
HTTP
Формат электронной почты
IMAP версии 4 издание 1 (IMAP4rev1)
Основным организационным подразделением, координирующим работу
по стандартизации Интернет, является ISOC (Internet Society), объединяющее
порядка 100 тысяч участников, которые занимаются различными аспектами
развития данной сети. ISOC курирует работу IAB (Internet Architecture
Board), включающую две группы:
- IRTF (Internet Research Task Force). Координирует долгосрочные
исследовательские проекты, относящиеся к TCP/IP;
- IETF (Internet Engineering Task Force). Инженерная группа,
определяющая спецификации для последующих стандартов Интернет.
Разработкой стандартов для сети Веб, начиная с 1994 года, занимается
Консорциум W3C (World Wide Web Consortium), основанный и до сих пор
возглавляемый Тимом Бернерсом-Ли.
Консорциум W3C – организация, разрабатывающая и внедряющая технологические
стандарты для Интернета и WWW. Миссия W3C
формулируется следующим образом: «Полностью раскрыть потенциал
Всемирной паутины путём создания протоколов и принципов,
8
Стр.8