Пошук в Інтернеті. Крупник А.Б.
Прочитавши цю книгу, написану живою, доступною мовою, ви навчитеся правильно ставити питання пошуковим системам в Інтернеті, зможете вільно орієнтуватися в Усесвітній павутині: знаходити необхідну інформацію, програми, нових друзів. Ви зрозумієте, як шукати в Інтернеті зображення, адреси і телефони, веб-камери, списки розсилки, електронні адреси. І найголовніше, ви навчитеся самостійно шукати те, про що не можна прочитати ні в одній книзі. Вам відкриється «прихований Інтернет» — гігантські сховища інформації, недоступні звичайним пошуковим системам. Численні приклади, приведені в книзі, допоможуть освоїти не тільки «техніку» пошуку, але і опанувати їм як мистецтвом.
Устройство Интернета
Можно сказать, что Интернет - это картинки (чаще говорят "странички"), которые видны в окне браузера. Но Интернет можно не только видеть, с ним можно взаимодействовать. Выбирая мышью тот или иной пункт, мы видим в окне браузера новую страницу каталога. Значит, Интернет - это картинки с живыми участками: выберешь мышью такой участок, и тебе покажут другую картинку. Найти "живой" участок, который часто называют ссылкой, очень легко - попадая на него, указатель мыши меняет форму (стрелка превращается в изображение руки), а в строке состояния браузера появляется адрес документа, который будет показан, если нажать левую кнопку мыши. Сайт - это набор документов, объединенных общей темой и служащих одной цели. Очень часто сайты способны взаимодействовать с пользователем - скажем, выдавать что-то по его запросу. List.ru, например, показывает документы, в описании которых есть заданные слова. Считается, что адрес сайта может содержать только префикс http:// и разделенные точками слова, например, http://list.maiL.ru. Объект с более сложным адресом, например, http://r.mail.ru/n8099/, в адресе которого помимо слов, разделенных точками, есть еще добавка (в данном случае - /п8099/), принято называть web-страницей. Но это разделение весьма условно, и часто для простоты любой интересный объект в Интернете, независимо от того, как выглядит его адрес, называют коротким словом "сайт". Адрес сайта в Интернете называют еще доменным именем, которое состоит из последовательностей доменов - символов, разделенных точками. Самый главный домен называется доменом первого уровня и стоит справа, в нашем случае это ru. Далее идет домен второго уровня, в нашем случае - это mail; затем домен третьего уровня (в нашем случае это list). Домены распределяются по иерархическому принципу: получить домен второго уровня можно у организации, владеющей доменом первого уровня. То есть получить домен mail можно у того, кто владеет доменом ru. Аналогично, получить домен третьего уровня можно у того, кто владеет доменом второго уровня. Так, домен list можно получить у хозяина домена mail. Все домены первого уровня уже имеют своих владельцев. Доменом .ru владеет организация РосНИИРОС (Российский НИИ развития общественных сетей). Часто по старшим доменам можно узнать, где расположен сайт. Домен ru говорит о том, что сайт находится в России, домен br указывает на Бразилию, а домен uk - на Великобританию. Домены второго уровня тоже могут многое сказать. Так, домен второго уровня nnov указывает, скорее всего, на Нижний Новгород, а домен spb - на Санкт-Петербург. В начале раздела я сказал, что Интернет - это картинки, которые нам показывает браузер. Это все равно, что сказать: "телевидение - это картинки, которые показывает телевизор". За экраном телевизора не видно телевизионной антенны, телевышки, сложной и дорогой техники. Точно так же окно браузера заслоняет внутреннее устройство Интернета - миллионы компьютеров, соединенных друг с другом. Сайты, о которых мы только что говорили, "живут" в компьютерах. С точки зрения компьютера сайт - это набор специальных файлов, формат которых понятен браузеру. Когда в поле Адрес браузера вводится строка http://list.mail .ru и нажимается клавиша Enter, Интернет за счет своих внутренних механизмов определяет, на каком компьютере находится сайт, далее туда посылается запрос - и, если нужный файл на месте, он отправляется браузеру, который отображает его в своем окошке. Иногда эти файлы нужно указывать явно: например, набирая в поле Адрес показанную ниже строку, мы просим сайт (его иногда называют сервером) www.lita.org выдать документ tooLkit.html. http://www.1ita.org/commi tte/toptech/toolki t.htm Если документ находится там, где указано, он посылается браузеру, и мы видим его в окне. Когда же документ явно не называется, как это было с каталогом List.ru, сайт знает, что выдать по умолчанию. Обычно этот документ называется index.html или index.htm, но возможны и другие названия. Расширения .html или. htm говорят об особом формате файлов, посылаемых браузеру и понимаемых им. Этот формат так и называется - HTML. В сущности, формат HTML очень прост - это язык разметки, где участки текста обрамляются специальными значками - тегами, которые подсказывают браузеру, что делать с выделенным текстом. Например, текст 0MAIL.ru, обрамленный тегами<
...>
, показывается браузером в левом верхнем углу окна. Это - заголовок документа. Начало текста главной страницы List.ru ! DOCTYPE html PUBLIC "-//W3C//0TD HTML 4.01 Transitional//EN" html head title@MAIL.RU /title Было бы неправильно в этом и без того трудном разделе, насыщенном новыми понятиями, говорить более подробно о формате HTML. Поговорим об этом чуть позже, в разделе "Устройство HTML-страниц". А напоследок - несколько слов о символах http://, которые ставятся перед каждым адресом сайта, например, list.mail.ru. Эти символы - вовсе не часть адреса, они только говорят, что браузер ожидает увидеть по адресу list.mail.ru web-сайт и готовится соответствующим образом отнестись к присланному документу. Перед адресом может стоять и другой значок, показывающий браузеру, что ожидается прием документа или сообщения иной природы. Ведь Интернет состоит не только из web-сайтов, а и из компьютеров, которые могут обмениваться сообщениями. Но о том, что это за сообщения и как ими обмениваться, речь впереди.