Сышышь ты, выходи сюда,
поговорим !

JavaScript SEO - Как Google Crawl JavaScript «SEOPressor - плагин для WordPress SEO

  1. Googlebot
  2. Кофеин
  3. Процесс сканирования и индексации для веб-страницы на основе JavaScript отличается
  4. Так что же происходит, когда поисковая система достигает ваших обычных страниц, не использующих Java-скрипт,...
  5. Теперь вот что происходит, когда робот Google достигает вашей веб-страницы JavaScript.
  6. Что происходит, когда Google с возможностями рендеринга достигает ваших веб-страниц на основе JavaScript.
  7. Подвести итоги…

В SEO мы всегда смотрим на ранги и SERP, но нам также нужно знать процесс, который происходит до этого

В SEO мы всегда смотрим на ранги и SERP, но нам также нужно знать процесс, который происходит до этого. Это сканирование и индексация.

Google ранжирует веб-страницы в своем индексе. Если ваша веб-страница не проиндексирована или неправильно проиндексирована, это повлияет на ваш рейтинг.

Интернет перешел от простого HTML - как SEO, вы можете принять это. Учитесь у разработчиков JS и делитесь с ними знаниями по SEO. JS не уходит. - Джон Мюллер Старший аналитик веб-мастеров

То, что вам нужно знать, это.

Процесс для веб-сайта JavaScript и веб-сайта, не поддерживающего JavaScript, сильно отличается, и именно поэтому JavaScript влияет на ваш рейтинг, если он не выполняется осторожно.

Google сказал в 2014 году что они пытаются лучше понимать веб-страницы, выполняя JavaScript. Но как они на самом деле это делают? И в какой степени они могут визуализировать JavaScripts?

Давайте подробнее рассмотрим весь процесс сканирования и индексации.

Кто или в этом случае что вовлечено в процесс?

Googlebot

Это гусеничный ход, также называемый пауком. Всякий раз, когда появляется новая веб-страница или какие-либо новые обновления на веб-странице, робот Googlebot будет первой точкой контакта с поисковой системой.

Он сканирует веб-страницы и переходит по всем ссылкам на веб-странице. Таким образом, бот обнаруживает больше новых ссылок и новых веб-страниц для сканирования. Просканированные веб-страницы затем передаются в кофеин для индексации .

Имейте в виду, что Googlebot может быть отказано в доступе с помощью robots.txt . Первое, что нужно иметь в виду, если вы хотите, чтобы ваши веб-страницы на основе JavaScript сканировались и индексировались, это не забудьте разрешить доступ для сканеров. Не забудьте также отправить свои URL-адреса в Google с помощью консоли поиска Google, отправив карту сайта XML.

Кофеин

Это индексатор, который был запущен еще в 2010 году , Все, что сканирует робот Googlebot, будет проиндексировано Caffeine, и этот индекс позволяет Google выбирать веб-страницы для ранжирования.

Помимо индексирования просканированного содержимого, Caffeine также делает одну важную вещь, которая также отображает веб-страницы JavaScript. Это очень важно, так как для JavaScript без рендеринга поисковая система не сможет проиндексировать весь контент веб-страницы .

Ссылки, обнаруженные при рендеринге, также будут отправлены обратно в робот Googlebot в очередь на сканирование, что приведет к повторной индексации. Это очень важный момент, который нужно иметь в виду, потому что одна важная часть SEO - это внутренние ссылки. Взаимосвязь ваших веб-страниц на вашем сайте дает Google сильный сигнал о таких вещах, как рейтинг страницы, авторитет и частота сканирования. Что все, в конце дня влияет на рейтинг страницы.

Что все, в конце дня влияет на рейтинг страницы

Вот быстрое изображение, которое подводит итог тому, что делают Googlebot и Caffeine.

Процесс сканирования и индексации для веб-страницы на основе JavaScript отличается

Здесь у нас есть простая графика из этого года Google I / O который показывает вам процесс от сканирования до индексации и рендеринга.

Это хорошо для того, чтобы получить общее представление обо всем процессе, но почему бы нам не приблизиться немного ближе?

Так что же происходит, когда поисковая система достигает ваших обычных страниц, не использующих Java-скрипт, на HTML?

    1. Googlebot загружает необработанный HTML-файл вашей веб-страницы.
    2. Googlebot передает HTML-файл в Caffeine, чтобы извлечь все ссылки и метаданные.
    3. Робот Google продолжает сканировать все обнаруженные ссылки.
    4. Извлеченный контент индексируется кофеином и используется для ранжирования.

Извлеченный контент индексируется кофеином и используется для ранжирования

Теперь вот что происходит, когда робот Google достигает вашей веб-страницы JavaScript.

    1. Googlebot загружает необработанный HTML-файл вашей веб-страницы.
    2. Там нет ничего, потому что все скрыто JavaScript.
    3. Кофеину нечего индексировать.
    4. Ваша веб-страница не имеет рейтинга, потому что там нет контента.

Ну, это был наихудший сценарий и то, что происходит, когда вы не реализуете свой JavaScript способом, который может быть воспроизведен поисковой системой. Так что индексированная версия вашей веб-страницы пуста, насколько беспокоит Google.

Теперь пустые веб-страницы не будут иметь хорошего рейтинга . Вот почему вы должны понимать, как реализовать свой JavaScript таким образом, чтобы он был полностью проиндексирован или как можно ближе к тому, как он выглядит для пользователя, использующего современный браузер.

К счастью, теперь у Caffeine есть возможность отображать ваши файлы JavaScript, как это делает браузер. Google подарил всем SEO и веб-разработчикам большой сюрприз, когда обнаружил, что WRS (служба веб-рендеринга) поисковой системы на самом деле основана на Chrome 41 . С Chrome 69 Появившись в сентябре, поисковая система сильно не в состоянии представить современный JavaScript. Но это лучше, чем ничего, верно?

Но это лучше, чем ничего, верно

В настоящее время Google возглавляет гонку, поисковая система которой может лучше индексировать ваши веб-страницы JavaScript. (ps: ask.com получает часть своей индексации от неназванной сторонней поисковой системы, я думаю, мы все знаем, кто это…)

Что происходит, когда Google с возможностями рендеринга достигает ваших веб-страниц на основе JavaScript.

    1. Googlebot загружает HTML-файл вашей веб-страницы.
    2. Первая индексация происходит мгновенно без отображаемого содержимого, в то время как Caffeine работает над отображением JavaScript.
    3. Любые извлеченные ссылки, метаданные, контент и т. Д. Передаются обратно роботу Google для последующего сканирования.
    4. Извлеченный контент индексируется во время второй индексации и используется для ранжирования.

Извлеченный контент индексируется во время второй индексации и используется для ранжирования

Значит ли это, что Google может без проблем сканировать и индексировать ваши веб-страницы на основе JavaScript? Ну, короткий ответ - нет. Я имею в виду, посмотри на Hulu ,

Google может сканировать JavaScript, но не весь JavaScript. Вот почему так важно реализовать постепенную деградацию ваших веб-страниц. Таким образом, даже если поисковая система не сможет правильно отобразить ваши веб-страницы, по крайней мере, это не будет катастрофическим (подумайте Хулу).

Для Google с поиском JavaScript важно то, что он тяжелый и дорогой . Первая индексация может происходить так же быстро, как они могут индексировать сторону HTML, но важная часть, вторая публикация индексации, будет помещена в очередь, пока у них не появятся свободные ресурсы для этого .

Что означает, представьте себе, вы подали Google еду, но, поскольку у них нет столовых приборов, чтобы съесть ее, они могут только судить, насколько она хороша, по внешнему виду, и сервер не вернется со столовыми приборами, пока они не " Принимая заказы еще от 3 других таблиц, Google опубликовал обзор на Yelp, в котором говорится, что ваша еда - дерьмо.

Звучит ли это справедливо и выгодно? Конечно нет.

Как и скорость сканирования, скорость и частота повторной индексации зависят от нескольких факторов: рейтинг страницы , обратные ссылки, частота обновления, объем посетителей и даже скорость вашего сайта ,

Так как же убедиться, что Google может правильно сканировать, отображать и индексировать ваш сайт JavaScript? Заметьте, не быстро, потому что это совсем другой вопрос.

Два важных инструмента, которые вы можете использовать, чтобы оценить, насколько хорошо Google может сканировать и индексировать ваш сайт JavaScript, используя инструмент извлечения и рендеринга из консоли поиска Google и браузера Chrome 41 (вы можете загрузить браузер здесь Кричи Слону и их офигенному посту Chrome 41 и рендеринг )

Два важных инструмента, которые вы можете использовать, чтобы оценить, насколько хорошо Google может сканировать и индексировать ваш сайт JavaScript, используя инструмент извлечения и рендеринга из консоли поиска Google и браузера Chrome 41 (вы можете загрузить   браузер здесь   Кричи Слону и их офигенному посту   Chrome 41 и рендеринг   )

Используйте функцию извлечения как функцию Google, чтобы проверить, может ли поисковая система правильно отображать вашу веб-страницу или нет. (источник)

Вы также можете перейти к Могу ли я использовать чтобы проверить, что поддерживается и не поддерживается в Chrome 41.

Веб-сайт дает вам четкое представление о том, что поддерживается и не поддерживается всеми версиями браузера. Используйте это, чтобы дважды проверить, может ли ваш сценарий быть выполнен Chrome 41, таким образом, предоставленный Caffeine.

Все это важные инструменты, которые помогут вам понять весь процесс сканирования, рендеринга и индексации. С этим у вас будет лучшее представление о том, где и что пошло не так.

Подвести итоги…

1. Googlebot сканирует, индекс кофеина и рендер.
2. Для веб-страниц HTML робот Google запрашивает страницу и загружает HTML, содержимое которого затем индексируется Caffeine.
3. Для веб-страниц JavaScript, робот Google запрашивает страницу, загружает HTML, сначала выполняется индексация. Затем кофеин рендерит страницу, отправляет обработанные ссылки и данные обратно в робот Googlebot для очереди сканирования, а после повторного сканирования выполняет вторичную индексацию.
4. Рендеринг требует значительных ресурсов, и вторая индексация будет помещена в очередь, что делает его менее эффективным.
5. Используйте инструмент извлечения и визуализации в Google Search Console и Chrome 41, чтобы оценить, насколько хорошо Google может проиндексировать вашу страницу JavaScript.

Вот еще один пост на JavaScript SEO, который может вас заинтересовать: SEO для сайтов на базе JavaScript (резюме Google IO 18)

Полиглот упал в глубокий синий мир SEO и въездного маркетинга, вооруженный пылкой страстью к письмам и увлечением тем, как все крутится во всемирной паутине.

Но как они на самом деле это делают?
И в какой степени они могут визуализировать JavaScripts?
Кто или в этом случае что вовлечено в процесс?
Это хорошо для того, чтобы получить общее представление обо всем процессе, но почему бы нам не приблизиться немного ближе?
Так что же происходит, когда поисковая система достигает ваших обычных страниц, не использующих Java-скрипт, на HTML?
Но это лучше, чем ничего, верно?
Значит ли это, что Google может без проблем сканировать и индексировать ваши веб-страницы на основе JavaScript?
Звучит ли это справедливо и выгодно?