Что такое кэш поисковой системы? Зачем он нужен?

Алексей Радкевич
Директор Студии ЯЛ

Когда робот поисковой системы (ПС) обходит сайт во время индексации, система автоматически сохраняет копию каждой посещенной страницы. Эти копии попадают в базу данных – кэш поисковой системы.

Кэшированные страницы могут отличаться от их текущих версий, потому что поисковая машина обновляет информацию с определенными временными интервалами, а контент на сайте может меняться чаще.

Особенности работы кэша поисковиков

  • Кэш и индекс – не одно и то же. В кэше хранятся копии веб-страниц, а в индексе – только текстовые фрагменты с ключевыми словами и URL страниц, которые проиндексировал робот.
  • В кэш не попадают динамические скрипты. Кэшированная страница содержит html-код текстового и статического контента. Видео, графика и блоки, написанные на JavaScript, Flash и Ajax не сохраняются в кэш. Но если поставить на них абсолютные ссылки, то эти блоки будут отображаться на кэшированной странице.
  • Кэш – одна копия страницы. В базе данных поисковой системы хранятся наиболее актуальные копии каждой страницы. При каждом переобходе роботом информация в кэше обновляется и перезаписывается, старые версии при этом удаляются.

Кэш поисковой системы позволяет:

  • увидеть сохраненную ранее копию страницы и ознакомиться с контентом, который был на ней в момент индексации;
  • проверить, какие внесенные изменения на сайте были проиндексированы, а какие – нет;
  • узнать, учитывает поисковая система ссылку на ресурс или нет;
  • восстановить удаленные данные;
  • оценить уникальность размещенного на странице текста;
  • определить точную дату индексации.

Кроме того, кэш помогает посмотреть содержимое сайта, который система считает потенциально опасным и запрещает открывать актуальную страницу.

Как часто поисковые системы обновляют кэш

В Яндексе актуализация (апдейт) сохраненной копии происходит 1-2 раза в неделю. Система проверяет текстовое наполнение и ссылки. Пересчет ТИЦ (тематического индекса цитирования) производится реже – 1 раз в 2 месяца.

В Google нет фиксированной периодичности обновлений кэша. Все зависит от робота – когда он посчитал нужным зайти на страницу, тогда кэш и обновится.

Как посмотреть кэш поисковой системы

Ссылка на сохраненную копию страницы размещается в сниппете в выдаче поисковых результатов. Чтобы ее увидеть, нужно нажать на стрелку рядом со ссылкой на страницу.

Так это выглядит в Яндексе:

Яндекс кэш

А так – в Google:

Гугл кэш

Иногда в выдаче не показывается ссылка на сохраненную копию. Например, как здесь:

Без сохраненной копии

Это означает, что вебмастер по какой-то причине не хочет открывать доступ к кэшу посторонним лицам. Поэтому прописал атрибут Robots: <meta name="robots" content="noarchive"/>. После этого ссылка на кэш не отображается в результатах поисковой выдачи, но сама страница все равно индексируется поисковыми роботами, если это тоже не запрещено в файле robots.txt.

Зачем и как удалить страницу из кэша поисковой системы

В процессе работы SEO-специалисты сталкиваются с разными проблемами, одна из которых – копирование контента с их сайта. Из-за этого проседают позиции, и процесс продвижения ставится под вопрос. Если удается добиться, чтобы сайт «воров» перестал работать, страницы начинают отдавать ошибку 404, но продолжают оставаться в выдаче. В таком случае единственный способ решить проблему – удалить копии страниц из кэша.

Еще может произойти ситуация, когда на сайт попала нежелательная информация, которую оперативно удалили, но робот все же успел проиндексировать страницы, где она находилась.

Чтобы удалить кэшированные страницы из выдачи, нужно воспользоваться специальным инструментом – Google для веб-мастеров или Яндекс.Вебмастер. Для удаления страницы система может потребовать подтвердить права на владение сайтом.


Еще ответы по теме:

Наши работы

  • Кико бум
    Интернет-магазин детской одежды
    «Kiko Бум»
  • Мир природы
    Интернет-магазин натуральной косметики
    «Мир Природы»
  • Look Russian
    Женская одежда оптом
    «Look Russian»
Вернуться в раздел
Комментарии
Za/Man 31 Май 21 в 10:10

Как долго может храниться кеш поисковой системы?

Ответить
1 Ответ
Алексей Радкевич 31 Май 21 в 11:20

Кому: Za/Man, может достаточно долго. Особенно если эти страницы попали в разряд "малокачественных". Особенно это касается больших порталов СМИ, некоторые страницы на них посещаются роботом один-два раза и он о них забывает на долгие годы.

Обновить эти страницы можно через МАССОВЫЕ изменения. Например, внутренними ссылками, изменение метатегов или появления нового контента на страницах.

Алексей Радкевич 31 Дек 20 в 17:17

Дополнение: ТИЦ "покинул нас", примерно как ВИЦ до него и это правильно, поскольку ТИЦ относится исключительно к количеству ссылок которые ведут на сайт. А новый параметр ИКС отвечает уже за группу факторов, важнейшими из которых являются поведенческие факторы и удобство использования сайта.

Оставьте свой комментарий