"Дмитрий Леонов. Использование Perl в интернет-технологиях" - читать интересную книгу автора

из прочих категорий), администрированием которых до недавнего времени
занимался только InterNIC, .gov (изначально предназначался для любых
государственных учреждений, позднее было принято решение о регистрации в нем
только федеральных правительственных учреждений США, регистрируются US
Federal Government civilian agency), .mil (военные учреждения США,
регистрируются US military agency), .int (международные организации). В
настоящее время ведется работа по введению дополнительных доменов верхнего
уровня. Кроме того, к доменам верхнего уровня относятся национальные домены
с двухбуквенными именами (например, .ru, .de), администрированием которых
занимаются национальные институты.


Порты и службы
Ip-адрес позволяет точно идентифицировать компьютер, но этого
недостаточно. Дело в том, что на каждом узле могут быть запущены самые
разные службы Internet - обеспечивающие передачу электронной почты, файлов,
гипертекстовой информации и т.п. Каждая служба использует в своей работе тот
или иной протокол прикладного уровня. Для передачи файлов - это протокол FTP
(File Transfer Protocol), передачи web-страниц - протокол передачи
гипертекстовой информации HTTP(HyperText Transfer Protocol), для работы с
электронной почтой - протоколы SMTP, POP3, IMAP и т.д.
Для каждой службы отведен отдельный порт, представляющий собой число от
0 до 65534. Для наиболее популярных служб зарезервированы стандартные номера
портов. Так, для FTP это 21, для HTTP - 80, SMTP - 25, POP3 - 110. Впрочем,
это лишь значения по умолчанию, никто не мешает владельцу узла настроить эти
службы на работу с другими портами. Иногда это просто необходимо - как,
например, в случае с поддержкой различных кодировок кириллицы в WWW. Как
известно, одни и те же символы кириллицы в различных операционных системах
обозначаются разными кодами, и существует по крайней мере четыре популярные
кодировки: Windows-1251, KOI8, Mac, DOS. Поскольку одна и та же страница
может быть загружена пользователями различных систем, перед ее разработчиком
встает непростая задача - как сделать ее читаемой для всех. Существует три
подхода к решению этой задачи. Во-первых, можно просто проигнорировать
существование нескольких кодировок и готовить страницу в самой популярной,
каковой на сегодня является Win1251. Во-вторых, готовить несколько копий
страниц - во всех кодировках. Недостатки этих подходов очевидны. Наиболее
популярным на сегодняшний день является решение, предусматривающее
автоматическую перекодировку документа на сервере - в зависимости от того,
с каким портом общается клиентское приложение: например, на 8080 - Win1251,
8083 - Koi8 и т.п.


URL
Унифицированные указатели ресурсов (Uniform Resource Locator, URL)
предназначены для адресации сетевых ресурсов - документов, файлов и т.п. В
самом общем виде URL записывается следующим образом:
[протокол]://[имя][:пароль]@[адрес][:порт][/путь/][документ][?дополнительная
информация]
Содержимое квадратных скобок является необязательным, любая часть URL
может быть опущена. Здесь