Мы уже говорили о том, что Google индексирует все страницы подряд, независимо от языка, на котором они написаны. В индекс Google попадают документы на китайском, японском, шведском и, конечно же, русском языках. Поэтому система Google пригодна для поиска и в русскоязычном Интернете. Правда, есть одно неудобство: Google не знает, как отобразить буквы иных алфавитов, поэтому краткие сведения о найденных страницах подчас выглядят очень загадочно. Хоть в поле поиска и был введен запрос Двенадцать стульев, Google показывает в графе Searched the web for странную последовательность значков Д:в... Правда, если вспомнить раздел "Кодировки", то станет ясно, что значки эти - просто числовые значения для русских букв в кодировке Unicode. Числу 1044 соответствует прописная буква Д, числу 1074 - строчная буква в, и т. д. Если слова, в поле поиска Google еще хоть как-то отображает, то в результатах поиска вместо русских букв стоят одни вопросительные знаки. К счастью, есть довольно простой способ вернуть русские буквы на место. Для этого нужно пройти к системе Google не через парадный (www.google.com), а через боковой ход (www.google.com.ru), специально предназначенный для тех, кто говорит на русском языке. Введя в поле поиска ту же фразу, получим те же результаты, но теперь описания страниц сделаны на чистейшем русском языке, что очень облегчает поиск . Например, в документе, показанном вторым, обнаружилось слово "купить" - значит, здесь, скорее всего, лишь описание романа. А вот в странице, стоящей на четвертом месте, есть слова "OCR" (то есть распознавание текста, "сверка"), и это говорит о том, что текст романа где-то рядом. Пятый документ в результатах поиска показан с отступом - значит, найден он на том же сайте, что и предыдущий. Документ этот очень мал (3 Кбайт), но то, что находится он на сайте lib.ru (очевидно, "lib" - это сокращенное "library", библиотека) в папке ILFPETROV и содержит упоминание о двух изданиях романа "Двенадцать стульев" (1958 и 1997 годов), заставляет предположить, что найдено целое собрание текстов Ильфа и Петрова. Любопытный читатель может сам проверить эту гипотезу. А нам осталось только сказать, что русскоязычный сайт www.googLe.com.ru - не какая-то особая поисковая система, а лишь иной ход к уже известному нам индексу Google. Здесь такой же язык запросов, те же префиксы, та же нечувствительность к регистру, справедливая и для русских букв. Как и на основном сайте, слова здесь понимаются буквально: Google не занимается перебором грамматических форм, поэтому слово "двенадцать" не имеет для него ничего общего со словом "двенадцати", - и это может помочь, когда ищется известная фраза, или помешать, когда точная форма слова неизвестна.