Часто задаваемые вопросы
В любой конференции Usenet есть круг периодически появляющихся вопросов, на которые старожилам конференции приходится вновь и вновь отвечать. Эти вопросы, обычно задаваемые новичками, интересны всем участникам конференции, просто кое-кто уже знает ответы на них, а кое-кто - нет. И вот, чтобы не топтаться на месте, все время отвечая на одни и те же вопросы, кто-нибудь из старожилов берет на себя труд собрать в одном месте основные вопросы, задаваемые в конференции, и дать на них ответы. Так возникают сборники часто задаваемых вопросов (Frequently Asked Questions, FAQ). FAQ - это плод коллективного труда участников конференции, в нем содержится информация, интересная большинству. И правила хорошего тона требуют, прежде чем задавать вопрос в конференции, прочитать соответствующий сборник FAQ. Сборник FAQ может быть интересен не только участникам конференции, но всем, кто хочет прочитать энергичное, краткое и конкретное введение в ту или иную область знаний. Поэтому существуют архивы, где содержатся все доступные сборники FAQ, - эти архивы могут быть построены как тематические каталоги, где нужный сборник FAQ отыскивается в каком-то разделе, или как поисковые системы, где все тексты индексируются, и становится возможен поиск того или иного слова во всем архиве. Одна из наиболее известных поисковых систем, позволяющих искать нужную информацию в сборниках FAQ, расположена по адресу www.faqs.org, . Но прежде чем искать что-то в сборниках FAQ, стоит оценить размер этой новой базы данных. Как мы уже знаем, существует несколько десятков тысяч конференций Usenet. Конечно, далеко не во всех конференциях есть сборники FAQ, и разумно предположить, что различных сборников FAQ в базе - тысяч десять. Много это или мало? Если предположить, что каждый сборник FAQ занимает в среднем 100 Кбайт, то все они займут 1000 Мбайт, то есть 1 Гбайт, и могут уместиться на обычном жестком диске. То есть база данных совсем невелика. Но это не повод, чтобы относиться к ней пренебрежительно. Маленькая база данных может оказаться полезнее большой, если правильно с ней обращаться. Каждая база данных требует особого подхода. Запрашивая огромную базу данных, например, Google, мы должны очень точно формулировать запрос, чтобы получить разумное число документов, в которых содержится именно то, что нужно. Обращаться к малой базе данных нужно с более общими вопросами. Когда размер поисковой системы неизвестен, представление о нем можно получить экспериментально. Если в ответ на запрос база данных выдает слишком много документов, то запрос нужно уточнять. Если же документов слишком мало или нет совсем, база данных мала для такого запроса и нужна более общая его формулировка. Пусть нам захотелось узнать о том, как получить музыкальные файлы в формате МРЗ. Поскольку база данных невелика, не будем составлять запрос из нескольких слов, а просто наберем в окне поиска символы МРЗ и нажмем кнопку Search . Результаты поиска показывают, что запрос был слегка неконкретен даже для небольшого собрания сборников FAQ. Слово "МРЗ" встретилось в 60 самых разных файлах, посвященных Оззи Осборну, сатанизму, традициям кельтов и многому другому. Но на шестнадцатом месте, похоже, оказалось то, что мы ищем . Об этом говорят показанные поисковой системой строки, где встречается слово "МРЗ". Например, в четвертой снизу строке сказано: "Fancy audio extraction application. Can rip to MP3 and normalize sound" (Отличная программа для перевода звука в формат МРЗ с нормализацией), а во второй сверху строке говорится о записи файлов в формате МРЗ на компакт-диск. Чтобы прочитать документ, выберите его название мышью. Из его начала, видно, что он составлен для нескольких конференций: соmр.publish.cdrom.hardware, соmр.publish.cdrom.software и т. д. То, что показано на рисунке, - лишь четвертая часть документа. Как правило, первый удачный поиск - лишь звено в цепи последующих удач - прямое следствие того, что в Интернете похожие вещи лежат рядом. Вот и сейчас можно обратиться к другим частям документа, просто выбрав подходящее название мышью.