Рамблер
Более тысячи лет назад святые Кирилл и Мефодий совершили стратегическую ошибку, взяв за основу русской азбуки греческие буквы. Одно из самых страшных ее последствий - необходимость терять время на переключение регистра клавиатуры - проявилось лишь несколько десятилетий назад, когда были изобретены компьютеры. Другое, гораздо менее значимое - необходимость писать отдельную главу о поиске в русскоязычных документах. Попробуем узнать подробнее о происхождении русской письменности, на этот раз с помощью поисковой системы Рамблер. В разделе "Рейтинги" мы уже говорили о Рамблере как о рейтинге российских сайтов. В этом разделе уместно будет сказать, что Рамблер - не только и не столько рейтинг, сколько автоматический индекс, примерно такой же, как и Апорт. Действительно, на главной страничке Рамблера в самом верху есть поле Поиск и кнопка Найти! для отправки запроса . Чтобы найти документы, где рассказывается о создании русской письменности, разумно ввести в поле поиска слова "история", "русской", "письменности", окружив введенные слова кавычками, чтобы задать поиск фразы, и нажать кнопку Найти! Как видим, уже первый (из 16 найденных) документ, судя по его заголовку, а также началу, показанному Рамблером, дате последнего изменения (3 сентября 2001 года) и размеру (12 Кбайт), вполне отвечает нашим ожиданиям. Возможно, и остальные 15 страниц что-то говорят о русской письменности. Но все ли это документы? Не пропущено ли что-то важное? Чтобы правильно ответить на эти вопросы, нужно знать язык запросов Рамблера. Пока нам известно, что Рамблер ищет фразу, когда слова в поле поиска обрамлены кавычками. Важно понимать, что слова, составляющие фразу, Рамблер оставляет неизменными. Если вспомнить наш запрос, то Рамблер найдет документы, содержащие фразу "история русской письменности", но не найдет фразы "истории русской письменности". Для поиска всех грамматических форм слова необходимо освободить его от кавычек, введя в поле поиска несколько разделенных пробелами слов. В нашем случае такими словами могут быть "Кирилл", "Мефодий", "русская", "письменность". По такому запросу Рамблер находит уже 613 сайтов и 1339 документов. Как видим, Рамблер выделил полужирным шрифтом слова "русской", "письменности", то есть между словами "русская" и "русской" не делается различий, все грамматические формы считаются одним словом. Но стоит заключить слово в кавычки, и Рамблер станет искать в точности то, что указано. По следующему запросу будут найдены документы, где есть слова "русская", "письменность" и любые грамматические формы слов "Кирилл" (например, "Кирилла") и "Мефодий": Кирилл Мефодий "русская" "письменность" По умолчанию Рамблер ищет документы, где есть все разделенные пробелами слова. Но практически все современные поисковые системы пытаются догадаться, что же имел в виду ищущий, поэтому лучше явно указывать Рамблеру, что он должен сделать. Если нужно найти все слова, между ними ставится логический оператор AND. По следующему запросу будут найдены документы, где есть оба слова (с учетом их изменчивости): Кирилл AND Мефодий Но если нужно найти одно из нескольких слов, используйте оператор OR, например: (письменность OR алфавит OR азбука) AND русская AND "кирилл" AND "мефодий" Этот запрос означает, что ищутся страницы, где обязательно есть слова "кирилл", "мефодий", одна из грамматических форм слова "русская" и одно из слов: "письменность", "алфавит", "азбука" (с учетом их грамматической изменчивости). В последнем примере слова "кирилл" и "мефодий" написаны со строчной буквы, потому что Рамблер все равно перед тем, как обратиться к своему индексу, превращает прописные буквы в строчные. Кроме операторов AND и OR, в Рамблере есть еще оператор NOT, позволяющий найти документы, где нет заданного слова (фразы). По следующему запросу будут найдены страницы, где есть слова "история", "русской", "письменности" (с учетом их грамматической изменчивости), но нет слова "Кирилл": история AND русской AND письменности NOT Кирилл С помощью оператора NOT можно составлять очень сложные запросы, например: история AND русской AND письменности NOT (Кирилл OR Мефодий) Этот запрос командует Рамблеру искать страницы, где есть все три слова, соединенные оператором AND, и нет ни слова "Кирилл", ни слова "Мефодий". Понять это можно с помощью такого запроса к поисковой системе: Кирилл OR Мефодий В этом случае нашлись бы документы, где есть либо слово "Кирилл", либо слово "Мефодий", либо оба эти слова. Очевидно, все документы, проиндексированные поисковой системой, можно разделить на две части: первая отвечает запросу Кирилл OR Мефодий, вторая - нет. Так вот: оператор NOT как раз и командует поисковой системе показать эту вторую часть. Очевидно, в этой части как раз и собраны страницы, в которых нет ни слова "Кирилл", ни слова "Мефодий". Нам осталось познакомиться с режимом расширенного поиска, настроить который можно, выбрав мышью ссылку Расширенный поиск, которая видна правее кнопки Найти! В поле поиска можно вводить слова, связанные логическими операторами (при этом в группе Искать слова запроса должен быть установлен переключатель все), а можно просто указывать, ищется ли хотя бы одно из выбранных слов или точная фраза. Можно указать, где будет идти поиск - в самих документах, в названиях (title) или заголовках, обрамленных тегами hl...h5. Можно ограничить расстояние между словами; это, конечно, не заменит поиск фраз, но способно иногда облегчить задачу. Можно задать поиск только на определенных сайтах (Искать документы только на следующих сайтах). Можно искать документы, созданные в указанный промежуток времени (Дата документа). Наконец, можно сортировать страницы не только по их соответствию запросу (релевантности), но и по дате, а также задать поиск документов, не содержащих заданных слов (Исключить документы, содержащие следующие слова).