среда, 29 июля 2009 г.

Как работают поисковики?


Поисковики употребляют определенный перечень операций, который дозволяет им обеспечить релевантные результаты в выдаче.

1. Продвижение по сети

Поисковики употребляют автоматические программы, именуемые ботами либо спайдерами, которые употребляют гипертекстовую структуру сети для прохождения по страничкам и документам, которые сочиняют Всемирную сеть. Существует предположительно 20 млрд страничек, поисковики выучили от 8 до 10 млрд.

2. Индексация документов

Опосля прохождения страницы ее контент быть может проиндексирован, другими словами сохранен в громаднейшей базе данных документов, которая сочиняет “index” поисковой системы. Управление индексом обязано производиться таковым образом, что запросы, по которым делается поиск и сортировка млрд документов, обязаны быть обработаны за части секунды.

3. Обработка запросов

Когда запрос на информацию поступает к поисковику « сотки миллионов каждый день », он извлекает из собственного индекса все документы, которые подходят запросу. Соответствие определяется, ежели слова либо фраза находятся на странице в виде, определенном юзером. К примеру, по запросу авто и журнальчик водителя в Google выводятся 8. 25 миллионов результатов. Но поиск той же фразы в кавычках приведет к выдаче лишь 166 тыщ результатов. В первой системе, которая называется режим “Findall”, Google извлекает все документы, которые имеют слова “авто”, “водитель” и “журнал” « Google пренебрегает слово “и”, так как ограничение результатов поиска не является действенным ». Во 2-м запросе “авто и журнальчик водителя” были выданы только страницы, точно подходящие набранному запросу. Иные поисковики могут иметь другие методы для выдачи подходящих запросу результатов « У Google имется перечень из 11 операторов ».

4. Ранжирование результатов

Опосля определения поисковиком результатов, подходящих запросу метод поиска « математическое уравнение, используемое для поиска » производит расчет по каждому результату поиска для определения более релевантного запросу результата. Сортировка результатов выдачи делается в порядке убывания ступени релевантности результатов запросу.

Желая операции поисковиков не являются необыкновенно длинноватыми, поисковые системы, такие как Google, Yahoo!, AskJeeves и MSN являются одними из самых трудных компов в мире. Они создают миллионы расчетов каждую секунду и обрабатывают информационные запросы громадных групп юзеров.

Тут будет рекламa oO

=)
 

Copyright 2008 All Rights Reserved Revolution Two Church theme by Brian Gardner Converted into Blogger Template by Bloganol dot com