Эксперимент со скрытием контента на странице от поисковиков (SEO-hide)

Сложность статьи:Продвинутым

Решил я закрыть даты публикаций на этом блоге от поисковиков (есть большие основания считать, что публикациям со старыми датами поисковики дают значительно меньше трафика).

С первой попытки убрать даты не получилось

Убрали мы их полностью со страниц сайта так, что если искать их по коду странички, то дат нигде нет. Они подгружаются из базы через джаваскрипт. Но не тут то было. Выяснилось, что Гугл продолжает видеть даты:

Я естественно проверил дату переиндексации странички. Страничка переиндексировалась уже после того, как мы скрыли даты. Но факт остается фактом. Гугл продолжает их видеть.

Версии

Нами были выдвинуты 3 гипотезы:

  1. Мы где-то оставили след и Гугл по нему определил дату
  2. Дата берется из кеша странички
  3. Гугл стал настолько крут, что теперь он выполняет любой код на странице и скрыть от него ничего не получится

 

Эксперимент

Для эксперимента я поменял дату публикации. Была дата "04 сентября 2017", стала "26 октября 2017". Плюс, выяснилось, что дата присутствует в XML-карте сайта (в поле lastmodified). Т.к. публикацию я обновил, то и дата в этом поле тоже изменилась (на "20.09.2019"):

Также, дата обнаружилась рядом со ссылкой на публикацию в html-карте сайта:

Ее мы тоже поменяли на "13 ноября 2018". Хотя если честно, я не думаю, что Гугл берет дату отсюда. Но ради эксперимента можно и эту дату поменять.

Итоги эксперимента:

По прошествии месяца в Гуге стоит дата: 26 октября 2017. Т.е. подтвердилась версия номер 3.

Это означает, что Google при индексировании сайта выполняет JavaScript-код. А значит, скрыть от него контент таким способ не удастся.

ПС: после данного эксперимента я прочитал множество материалов и других экспериментов на данную тему, и теперь точно понятно, что Гугл рендерит странички сайта во время индексирования. Поэтому гарантированно закрыть что-то от индексации стало достаточно проблематично. Да, есть сложные способы, но даже они не имеют 100%-ной гарантии.

ППС: в кэше Гугла показывается страничка без даты публикации. Это означает, что нельзя однозначно доверять кэшу. Так происходит из-за того, что существует несколько разных индексаторов. Первичный сканирует чистый html, другие рендерят скрипты.

3 499

нет комментов

Рубрики: SEO Продвинутым

КОММЕНТАРИИ

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

САМЫЕ
ПОПУЛЯРНЫЕ
СТАТЬИ за 6 мес


НАШИ КЛИЕНТЫ


ОТЗЫВЫ


Спасибо! Вы подписаны на наши обновления

Подписаться на блог