Что такое кэш поисковой системы? Зачем он нужен?

Когда робот поисковой системы (ПС) обходит сайт во время индексации, система автоматически сохраняет копию каждой посещенной страницы. Эти копии попадают в базу данных – кэш поисковой системы.

Кэшированные страницы могут отличаться от их текущих версий, потому что поисковая машина обновляет информацию с определенными временными интервалами, а контент на сайте может меняться чаще.

Особенности работы кэша поисковиков

  • Кэш и индекс – не одно и то же. В кэше хранятся копии веб-страниц, а в индексе – только текстовые фрагменты с ключевыми словами и URL страниц, которые проиндексировал робот.
  • В кэш не попадают динамические скрипты. Кэшированная страница содержит html-код текстового и статического контента. Видео, графика и блоки, написанные на JavaScript, Flash и Ajax не сохраняются в кэш. Но если поставить на них абсолютные ссылки, то эти блоки будут отображаться на кэшированной странице.
  • Кэш – одна копия страницы. В базе данных поисковой системы хранятся наиболее актуальные копии каждой страницы. При каждом переобходе роботом информация в кэше обновляется и перезаписывается, старые версии при этом удаляются.

Кэш поисковой системы позволяет:

  • увидеть сохраненную ранее копию страницы и ознакомиться с контентом, который был на ней в момент индексации;
  • проверить, какие внесенные изменения на сайте были проиндексированы, а какие – нет;
  • узнать, учитывает поисковая система ссылку на ресурс или нет;
  • восстановить удаленные данные;
  • оценить уникальность размещенного на странице текста;
  • определить точную дату индексации.

Кроме того, кэш помогает посмотреть содержимое сайта, который система считает потенциально опасным и запрещает открывать актуальную страницу.

Как часто поисковые системы обновляют кэш

В Яндексе актуализация (апдейт) сохраненной копии происходит 1-2 раза в неделю. Система проверяет текстовое наполнение и ссылки. Пересчет ТИЦ (тематического индекса цитирования) производится реже – 1 раз в 2 месяца.

В Google нет фиксированной периодичности обновлений кэша. Все зависит от робота – когда он посчитал нужным зайти на страницу, тогда кэш и обновится.

Как посмотреть кэш поисковой системы

Ссылка на сохраненную копию страницы размещается в сниппете в выдаче поисковых результатов. Чтобы ее увидеть, нужно нажать на стрелку рядом со ссылкой на страницу.

Так это выглядит в Яндексе:

Яндекс кэш

А так – в Google:

Гугл кэш

Иногда в выдаче не показывается ссылка на сохраненную копию. Например, как здесь:

Без сохраненной копии

Это означает, что вебмастер по какой-то причине не хочет открывать доступ к кэшу посторонним лицам. Поэтому прописал атрибут Robots: <meta name="robots" content="noarchive"/>. После этого ссылка на кэш не отображается в результатах поисковой выдачи, но сама страница все равно индексируется поисковыми роботами, если это тоже не запрещено в файле robots.txt.

Зачем и как удалить страницу из кэша поисковой системы

В процессе работы SEO-специалисты сталкиваются с разными проблемами, одна из которых – копирование контента с их сайта. Из-за этого проседают позиции, и процесс продвижения ставится под вопрос. Если удается добиться, чтобы сайт «воров» перестал работать, страницы начинают отдавать ошибку 404, но продолжают оставаться в выдаче. В таком случае единственный способ решить проблему – удалить копии страниц из кэша.

Еще может произойти ситуация, когда на сайт попала нежелательная информация, которую оперативно удалили, но робот все же успел проиндексировать страницы, где она находилась.

Чтобы удалить кэшированные страницы из выдачи, нужно воспользоваться специальным инструментом – Google для веб-мастеров или Яндекс.Вебмастер. Для удаления страницы система может потребовать подтвердить права на владение сайтом.

Вернуться в раздел
Комментарии
Оставьте свой комментарий