Робот (англ. crawler) хранит список URL, которые он может
проиндексировать, и регулярно выкачивает соответствующие им документы.
Если при анализе документа робот обнаруживает новую ссылку, он добавляет
ее в свой список. Таким образом, любой документ или сайт, на который
есть ссылки, может быть найден роботом, а значит, и поиском Яндекса. Какие бывают индексирующие роботыВ
Яндексе есть несколько видов роботов, которые выполняют разные функции.
Например, есть робот, который индексирует rss-ленту для поиска по
блогам. Или робот, который индексирует только картинки. Самый важный —
основной индексирующий робот, функция которого — поиск и индексирование
информации для формирования базы основного поиска. В помощь
основному есть быстрый робот — он предназначен для оперативного
индексирования свежей, актуальной на данный момент информации. Если
среди проиндексированных страниц своего сайта вы видите две копии
какого-либо документа — скорее всего это означает, что помимо основного
робота документ также был проиндексирован и быстрым роботом.
Источник: http://help.yandex.ru/webmaster/?id=995324 |