Контакти;

Все для мобілки: Мобільні новини; Каталог WAP-ресурсів; Розповіді про мобілки; Різне.

 
Все для компьютера: Жосткі диски; Процесори; Графіка; Принтери; Системні плати; Інтернет; Різне.
 
Україна: Нам пора для України жити! Вірші Констянтина Гайя; Ностальгія за минулим; Політика;

Основні розділи:

Конгрес Українських Націоналістів Rambler's Top100
Рейтинг@Mail.ru Украина онлайн

© Лихач М.В. sem@shynok.com.ua 2004рік

AllTheWeb

Когда было провозглашено, что Библиотека объемлет все книги, первым ощущением была безудержная радость. Каждый чувствовал себя владельцем тайного и нетронутого сокровища... На смену надеждам, естественно, пришло безысходное отчаяние. Мысль, что на какой-то полке в каком-то шестиграннике скрываются драгоценные книги и что эти книги недосягаемы, оказалась почти невыносимой.

X. Л. Борхес, Вавилонская библиотека

О системе AllTheWeb www.alltheweb.com, начавшей работать в середине 1999 года, до сих пор мало кто знает. Между тем, индекс AllTheWeb примерно равен по объему индексу Google. AllTheWeb, как и Google, постоянно развивается, и если сейчас можно всерьез говорить о конкурентах Google, то первый и чуть ли не единственный конкурент - это AllTheWeb. Попробуем же найти с помощью AllTheWeb тексты произведений Борхеса на английском языке. В том, что они существуют, нет никаких сомнений. Хоть Борхес и аргентинский писатель, чей родной язык - испанский, его книги давно переведены на многие языки, в том числе и английский. Чтобы начать поиск, нужно знать, как записывается "Борхес" латинскими буквами. Если верить книге, из которой я взял эпиграф к данному разделу, - это "Borges". Но обращаться к поисковой системе такого масштаба, как AllTheWeb, с одним словом рискованно. Поэтому переведем еще на английский название рассказа "Вавилонская библиотека". Найдя в русско-английском словаре перевод слова "вавилонский" (babylonian), получим перевод всей фразы - "babylonian library". Теперь у нас готов первый запрос: borges "babylonian library" В этом запросе все слова записаны строчными буквами: все равно система AllTheWeb нечувствительна к их регистру. Далее AllTheWeb ищет по умолчанию документы, где есть все введенные в поле поиска слова и фразы. Наш запрос означает поиск документов, где есть слово "borges" и фраза "babylonian library". Введя запрос в поле поиска и нажав кнопку SEARCH, получим первые результаты. Всего AllTheWeb находит 7 документов. Как видим, поиск оказался на редкость неудачным: краткие выдержки из найденных документов показывают, что все они имеют слабое отношение к Борхесу. Шестая и седьмая страницы содержат что-то из области физики, а пятая - репортаж с выставки, посвященной современным библиотекам. Сами по себе эти страницы нам не интересны, но фраза "The Library of Babel" в описании пятого документа показывает, как правильно перевести слова "вавилонская библиотека". Значит, запрос должен быть таким : borges "The Library of Babel". На этот раз поиск оказался гораздо удачнее . Найдено больше тысячи документов, причем уже два первых содержат текст "Вавилонской библиотеки". Но, к сожалению, на первых найденных сайтах нет никаких других рассказов Борхеса, а просмотреть тысячу с лишним документов невозможно. Значит, для продолжения поиска нужно как-то менять запрос. И первое, что приходит в голову, - поступить так же, как уже делали при поиске произведений Шекспира, то есть взять длинную цитату из только что найденного рассказа (например, "The orthographical symbols are twenty-five in number") и поискать ее в Интернете. Поступив так, получим всего двадцать адресов. Среди этих двадцати сайтов многие наверняка посвящены Борхесу. Найдется сайт и с биографией писателя, и со списком его произведений, и со статьями о Борхесе; но как отыскать тексты его рассказов? Видимо, придется просмотреть все двадцать адресов. Но совсем не обязательно делать это вручную, достаточно искать нужные слова прямо на сайте. Для этого в языке запросов AllTheWeb есть префикс url .host. По следующему запросу AllTheWeb будет искать слово "borges" на сайте astraldustbin.eLit.net, третьим: url.host:astral dustbin.el it.net borges Применив этот запрос, получим три адреса, среди которых не только известный уже рассказ "Вавилонская библиотека", но и новый - "The Circular Ruins" ("В кругу руин"). Цитату из этого рассказа снова можно использовать в качестве "затравки" - в надежде на то, что "всплывут" новые сайты, где, возможно, и нет "Вавилонской библиотеки", но зато есть другие рассказы Борхеса. Вы, наверное, уже заметили, что поиск цитаты из "Вавилонской библиотеки" оказался совсем не так удачен, как поиск цитаты из "Гамлета". В разделе ""Гамлет" и Google" мы практически сразу нашли сайты, хранящие все основные тексты Шекспира. Но Борхес - не Шекспир. Книги Борхеса пока продаются в обычных магазинах, а в Интернете они - большая редкость. Поэтому для поиска его текстов необходимы самые разные подходы; некоторые из них мы сейчас постараемся наметить. Прежде всего можно пытаться искать документы, чьи адреса содержат слова "borges", "texts". Если бы удалось найти документ по адресу www.site.com/texts/borges/babel.htm, можно было бы с большой долей уверенности утверждать, что найдена коллекция текстов Борхеса. Соответствующий запрос к AllTheWeb выглядит так: url.all:borges url.all:texts По этому запросу AllTheWeb находит 7 документов, причем некоторые из них на испанском и русском языках. Чтобы ограничиться только англоязычными сайтами, можно выбрать пункт English в раскрывающемся списке рядом с полем поиска (в левом верхнем углу). Сейчас в этом списке выбран пункт Any language (Все языки). Далее можно слегка поменять запрос, чтобы найти документы, в чьих адресах есть либо слово "text", либо слово "texts". Для таких запросов в поисковой системе обычно предусмотрен логический оператор ИЛИ. В AllTheWeb слова просто разделяются пробелами и заключаются в круглые скобки. По следующему запросу будут найдены документы, в чьих адресах обязательно есть слово "borges" и одно из двух слов - либо "text", либо "texts"1: url.all:borges (url.all:text url.all:texts) Наконец, можно искать страницы, в чьих заголовках есть слово "borges". Для этого применяется префикс normal .title. Соответствующий запрос выглядит как normal .title: Borges, но AllTheWeb выдает в ответ несколько тысяч документов. Для уточнения запроса потребуем, чтобы в документе под названием "Jorge Luis Borges" , была фраза "The Library of Babel". Соответствующий запрос выглядит так: normal.title:"Jorge Luis Borges" "The Library of Babel" По этому запросу AllTheWeb выдает несколько десятков адресов. Можно менять запрос, требуя, чтобы в документе были другие названия рассказов - те, что удалось узнать раньше. В этом разделе мы познакомились с примером трудного, неудачного поиска. Далеко не всегда удается с первого раза найти сайт, где есть все необходимое. Особенно когда такого сайта нет. Но если крепость нельзя взять штурмом, приходится переходить к осаде. Тем, кто действительно хочет найти все доступные тексты Борхеса, придется просматривать десятки сайтов, что потребует немалого времени. Сам переход к "осаде" переживается болезненно: кажется, что тексты Борхеса где-то собраны в одном месте, просто ты их не увидел. "Мысль, что на какой-то полке в каком-то шестиграннике скрываются драгоценные книги и что эти книги недосягаемы" сейчас так же невыносима, как и во времена Борхеса.  

 

 

Основы интернета