Введение в индексацию веб-страниц

Индексация веб-страниц

 

Индексация сайта

Как упростить поисковым роботам задачу индексирования сайта:

  • создать файл robots.txt
  • создать файл sitemap.xml
  • сообщить адрес нового сайта поисковым системам:


Как проверить орфографию, какие страницы сайта проиндексированы, нет ли ошибок в файлах robots и sitemap?

В помощь веб-мастерам поисковые системы предлагают:

Robots

Поисковые роботы первым делом просматривают файл robots.txt, чтобы узнать:

  • какие странички нельзя индексировать
  • путь к файлу sitemap.xml
  • есть ли у вашего сайта зеркала (индексируется только главное зеркало)
  • требуется ли делать паузы между загрузками страниц, чтобы не перегружать сайт
  • можно ли проигнорировать динамические параметры, не влияющие на содержимое сайта, чтобы не перегружать сайт.

Sitemap

Из файла sitemap.xml поисковые роботы узнают:

  • какие страницы сайта необходимо проиндексировать
  • дату последнего изменения страницы (в формате ГГГГ-ММ-ДД)
  • вероятную частоту изменения страницы (всегда, ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно, никогда)
  • какие страницы вы считаете наиболее приоритетными для индексирования (от 0.1 до 1.0).

Как быстро проверить, какие страницы сайта проиндексированы?

Наберите в строке поиска site:www.maxplant.ru

Поисковая система Пример запроса Посмотреть результат
Яндекс site:www.maxplant.ru
Google site:www.maxplant.ru
Bing site:www.maxplant.ru