Поиск на собственном диске
Хотя собственный жесткий диск и ничтожно мал по сравнению с Интернетом, через несколько месяцев работы бывает трудно разобраться даже в его содержимом. Особенно это справедливо для тех, кто по долгу службы собирает разнообразную информацию, регулярно получает электронной почтой новости; рассылки или, например, пишет книги. За примерами далеко ходить не надо. У меня на диске за время работы скопилось несколько тысяч файлов, занимающих примерно 300 Мбайт. И найти все упоминания о какой-то поисковой системе в этой груде материала становится невозможном без специальной программы, которая так же, как поисковая система в Интернете (Altavista, например), индексирует содержимое определенной папки жесткого диска и в дальнейшем позволяет делать запросы к полученной базе данных. Посмотрим же, как проиндексировать определенный участок жесткого диска с помощью демонстрационной версии программы Cros, которую можно найти на сайте www.cronos.ru. Cros - очень надежная, аккуратно сделанная и довольно быстрая программа. Единственный ее недостаток - совершенно непонятно, как ею пользоваться. Интерфейс Cros представляет собой некую загадку, и действия, которые нужно совершить, чтобы создать индекс, похожи на магические заклинания. Поскольку программа все же стоит потраченных на ее освоение усилий, рассказ о ней поневоле будет длинным. Установка Cros трудностей не вызывает. Нужно только указать папку, где окажутся соответствующие файлы. При первом запуске Cros спрашивает имя банка (так Cros именует собрание документов) и место на диске, где будут храниться построенные индексы . Нажимаем кнопку Создать, и перед нами возникает новое диалоговое окно . Нажимаем кнопку Область в правом верхнем углу и в появившемся окне задаем имя области. Пусть в нашем случае она называется "Search". После задания имени области ниже кнопки Область. Нажав кнопку Папка активизируется кнопка Папка, увидим очередное диалоговое окно , в котором задаем индексируемую папку и включаемые в индекс типы файлов. В нашем случае будут проиндексированы папка g:\search\sewatch и все вложенные в нее папки, а в индекс будут включены все файлы с расширениями .htm, .html, .txt и .doc. Обратите внимание на то, что разные расширения разделяются точкой с запятой. После того - как все эти параметры заданы, остается нажать кнопку Сохранить, и программа Cros снова вернет нас к исходному окну , только кнопка Добавить в его левом нижнем углу станет теперь доступной. Нажимаем кнопку Добавить, затем в появившемся окне (здесь не показанном) - кнопку Выполнить, и Cros начинает строить индекс. Время, необходимое для построения, зависит от многих факторов. Весь мой архив объемом 300 Мбайт программа Cros индексировала минут 40. Закрыв окно, мы завершаем создание индекса, и теперь можно приступить к поиску. Для этого в меню Режимы выбираем команду Строчный запрос, набираем в соответствующем поле искомое слово и нажимаем кнопку, на которой нарисован бинокль . В верхней части видны названия файлов, где есть слово "Infoplease", их размер и дата создания. В нижней части рисунка показан текст первого файла. Слово "infoplease" выделено в тексте красным цветом. Чтобы посмотреть текст другого файла, нужно выбрать его двойным щелчком мыши. Все показанные файлы имеют расширение .html, и, чтобы посмотреть их в браузере, нужно вызвать правой кнопкой мыши контекстное меню и выбрать там команду Внешняя программа. Запустится браузер, и файл будет показан во всей красе. Нам осталось сказать несколько слов о языке запросов, поддерживаемом программой Cros. В него входят основные логические операторы И, ИЛИ, НЕ и скобки: все эти элементы в виде значков . Cros позволяет искать и отдельные фразы. Для этого группу слов надо заключить в кавычки. Кроме программы Cros, есть еще одна программа для поиска на собственном диске, о которой стоит рассказать. Это программа Search32 фирмы Анет (www.anetsoft.com). Программа Search32 (по крайней мере, доступная мне версия 3.1) работает гораздо быстрее Cros, ее интерфейс прост и понятен, но, к сожалению, она весьма ненадежна, написана с большим количеством ошибок, и нужно некоторое время, чтобы освоиться с ней и не совершать действий, приводящих к краху операционной системы и потере всех несохраненных данных. Прежде чем искать что-то с помощью Search32, нужно создать индекс. Для этого вызываем программу, переходим на вкладку Индексы, пишем имя индекса, указываем путь к файлам, а также папку, в которой будет храниться индекс, и, наконец, нажимаем кнопку Создать . Как видно из рисунка, новый индекс называется search (поиск) и располагается в папке H:\index. В поле Расположение файлов указывается путь к индексируемым файлам и их типы. Запись g: \search\sewatch\*. htm+ означает, что будут индексироваться файлы с расширением .htm и .html из папки g:\search\sewatch. Знак "плюс" говорит о том, что будут индексироваться файлы во всех вложенных папках указанной папки. Как видно из рисунка, записи об индексируемых файлах разного типа разделяются точкой с запятой. После нажатия кнопки Создать Search32 начнет строить индекс; эта операция может быть долгой, если приходится индексировать сотни мегабайт данных и тысячи файлов. Но зато поиск после индексирования выполняется практически мгновенно. Чтобы найти что-то в созданном индексе, перейдем на вкладку Поиск ; выберем нужный индекс в раскрывающемся списке Индекс (в нашем случае это search); укажем слово, которое ищем, в раскрывающемся списке Поисковый запрос (в нашем случае это surfwax). Нажав кнопку 0К, увидим результаты поиска. Как показано на рисунке, в нашем случае найден один файл под именем INDEX-37.HTML, который тут же можно посмотреть (начало этого файла с расширением .html показано в нижней части рисунка). То есть в Search32 есть свой встроенный браузер. К сожалению, он не во всех случаях корректно показывает файлы с расширением. html. Однако всегда можно двойным щелчком мыши вызвать стандартный браузер, например Internet Explorer. Search32 позволяет строить и более сложные запросы. Можно соединять слова логическими операторами & (AND), | (OR), " (NOT). Слова, соединенные логическими операторами, можно заключать в круглые скобки. Например, следующий запрос означает поиск документов, в которых есть либо пара слов (teoma и hotbot), либо другая пара (directhit и lycos): teoma & (hotbot | lycos) Тот же запрос можно переписать так: (teoma & lycos) [ (teoma & hotbot) К сожалению, Search32 не понимает кавычек, хотя, чтобы найти фразу, чаще всего достаточно просто написать составляющие ее слова друг за другом.