Поиск в Usenet
Из четырех вкладок, которые видны на главной странице Google, нам пока понятны три: Web, Images, Directory. Настал черед последней, четвертой вкладки - Groups , ведущей к семистам миллионам сообщений, полученным за последние 20 лет в десятках тысяч конференций. Эти сообщения охватывают все возможные человеческие интересы, все области знания; они - бесценный материал для историков, социологов, а также для тех, кому нужны быстрые ответы на конкретные вопросы. Сообщения Usenet, как правило, небольшие по объему, и в них гораздо проще найти решение проблемы, чем в толстой (и уже устаревшей) книге, которую трудно снять с полки и донести до стола. Попробуем с помощью вкладки Groups системы Google решить задачу, с которой уже встречались, когда знакомились со списками рассылки: найти конференции, где люди обсуждают собак. Для этого наберем в поле поиска запрос dog и нажмем кнопку Google Search. В верхней части показаны наиболее подходящие, с точки зрения Google, конференции. Их имена говорят о том, что все они посвящены собакам. Попробуем "разобрать на части" имя первой конференции rec.pets.dogs.behavior. Группа геc, как мы уже выяснили, относится к развлечениям и домашним делам. Фрагмент pets означает "домашние животные", фрагмент dogs - собаки, a behavior - это по-английски "поведение". Значит, в конференции обсуждается поведение собак. Переводя на русский язык название конференции rec.pets.dogs.rescue, можно предположить, что в этой конференции обсуждают защиту ("rescue" - это "защита", "спасение") собак (может быть, бродячих?), но правильный ответ можно дать, только посмотрев сообщения конференции. Конференция alt.animals.dog, возможно обсуждает собак с биологической точки зрения, потому что слово "animals" - нейтрально и относится к любым животным: собакам, свиньям, волкам, да и к человеку тоже. Наконец, группы alt.pets.dogs.* (звездочка в конце названия показывает, что таких групп несколько) посвящены отдельным породам собак. Полный их список можно увидеть, выбрав мышью название alt.pets.dogs.*. Ниже названий самых подходящих конференций Google показывает сообщения, где встречается слово "dog". Одно из них видно в нижней части . Каждое сообщение начинается с заголовка; далее следуют фрагменты сообщения, где встречается слово "dog"; затем - конференция Usenet, из которой взято сообщение (у нас это rec.pets.dogs.behavior), дата и автор (Jerry Howe). Ссылка View Thread ведет к группе связанных сообщений, так называемой "нити", где обсуждается одна тема. Нити могут состоять из десятков сообщений, часто они вырождаются: участники дискуссии постепенно забывают о теме беседы, и дело (особенно в русскоязычных конференциях) кончается всеобщей ссорой и руганью. Поиск слова "dog", с которого начался этот раздел, дал более 5 миллионов результатов, что неудивительно для базы данных, хранящей сотни миллионов сообщений. Поэтому реальные запросы к Google должны быть гораздо более точными. Можно искать фразы, требовать, чтобы в сообщениях не было каких-то слов (ставя перед ними знак "минус"), а можно воспользоваться расширенным поиском, выбрав ссылку Advanced Groups Search. Форма для расширенного поиска. В ней можно задать поиск сообщений, где встречаются все указанные слова (with all of the words), целая фраза (with the exact phrase), любое из слов (with at least one of the words). Можно также указать слова, которых не должно быть в найденном сообщении (without the words). Далее можно выбрать конференции, где будет идти поиск (Return only messages from the newsgroup). В именах конференций можно обозначить звездочками любой фрагмент текста. Запись *dogs* обозначает конференцию, в названии которой есть фрагмент "dogs". Можно задать поиск в темах сообщений (Return only messages where the subject contains), указать автора сообщения (Return only messages where the author is) или его уникальный номер (Find the message with message ID). Можно ограничить поиск определенным языком, например, русским, а также задать временной интервал для поиска - либо отсчитываемый от текущей даты (Return messages posted), либо произвольный (Return messages posted between).