Сышышь ты, выходи сюда,
поговорим !

Увидеть дважды: ваше SEO руководство по дублированию контента

  1. Так что же такое дублированный контент?
  2. Насколько плохо?
  3. Dupes Happen
  4. 1. WWW и не WWW URL
  5. 2. HTTP против HTTPS
  6. 3. Трейлинг-слэш или нетрейлинг-слэш
  7. 4. Трейлинг слэш против расширения файла
  8. 5. Дублирующиеся URL с параметрами
  9. 6. Печатные каталоги
  10. 7. Домен против .com / index.html
  11. 8. Дополнительный промежуточный каталог
  12. 9. Дублированная информация о продукте
  13. 10. Скопированное или синдицированное содержимое
  14. И Дубликаты Умножаются!
  15. Работа с дубликатами
  16. Инструменты торговли
  17. Канонические метки
  18. 301 перенаправления
  19. Параметры URL консоли поиска Google
  20. Robots.txt
  21. Там может быть только один (URL)

Автор: Рон Сансоне 4. 25. 17 Автор: Рон Сансоне 4

Образ: Телепрограмма

С точки зрения органического поиска, проверка на наличие дублированного контента является частью любого тщательного анализа веб-сайта. Это невероятно распространенная проблема. Проработав в SEO более десяти лет, я провел бесчисленные аудиты сайтов, и дублирующий контент обнаружился как проблема почти во всех из них.

Но что такое дублированный контент? Почему это плохо? И что вы можете с этим поделать?

Вот основы дублированного контента, а также несколько советов о том, как позаботиться об этом.

Так что же такое дублированный контент?

Образ: Filmgarb.com

Дублированный контент на сайте, как правило, является результатом технической проблемы, возникающей в бэкэнде вашего сайта. С помощью ряда различных способов создаются две или более версии одной и той же веб-страницы, каждая из которых имеет свой собственный отдельный URL-адрес.

Вне сайта дублированный контент немного более коварный. Обычно это происходит, когда вы пишете особенно интересный или полезный фрагмент контента, и кто-то другой размещает его на своем сайте. Если вы не запланировали заранее, подражатель может рассматриваться как источник вместо вашего сайта.

Теперь нет ничего плохого в дублировании контента. Это просто избыточно. Для посетителя веб-сайта ничто не будет ошибочным. Но для поисковых систем, это совсем другое дело.

Насколько плохо?

Образ: YouTube

Обсуждая дублированный контент с точки зрения поисковых систем, люди, как правило, чрезмерно боятся его последствий. Многие предполагают, что за дубликаты страниц есть какой-то вид наказания Google или они считаются спамом. Ни то, ни другое не является правдой.

Настоящая проблема поисковых систем с дублированным контентом заключается в том, что это создает путаницу. Google пытается проиндексировать Интернет и предоставить наиболее релевантный контент для данного запроса. Это немного сложно сделать, когда две страницы абсолютно одинаковы, за исключением их URL.

Без каких-либо внешних указаний Google не будет знать, какой из двух (или более) дубликатов включить в свой индекс, чтобы приписать накопленные сигналы ссылки или ранжировать для конкретных результатов поиска. Для владельцев сайтов это может означать упущенные возможности ранжирования ключевых слов и органического трафика. Это также означает, что ваши усилия по созданию ссылок могут быть уменьшены несколькими версиями URL, а не одной целью. Конечным результатом всего этого является снижение видимости вашего контента.

Не беспокойся Это случается с лучшими из сайтов.

Dupes Happen

Образ: Pinterest

Дублирование контента может происходить по многим причинам. Вот несколько причин, с которыми я сталкиваюсь чаще всего:

1. WWW и не WWW URL

Это распространенная форма дублирования всего сайта, которая возникает, когда веб-мастер не может запланировать представление своей структуры URL «www.». Это означает, что есть один экземпляр сайта на http://www.example.com и полная копия его на http://example.com.

2. HTTP против HTTPS

При переходе на безопасную версию вашего сайта иногда HTTP-версия по-прежнему остается активной по ошибке.

3. Трейлинг-слэш или нетрейлинг-слэш

Еще один дубликатор для всего сайта, это происходит, когда на веб-сайте есть 200-кодовая страница для обеих этих перестановок: http://www.example.com/directory и http://www.example.com/directory/.

4. Трейлинг слэш против расширения файла

Это может происходить как для всего сайта, так и для конкретной страницы. Вот как выглядит этот тип дублирования: http://www.example.com/page/ и http://www.example.com/page.html. Любой тип расширения файла - .php., .Aspx и т. Д. - может быть причиной этого.

5. Дублирующиеся URL с параметрами

Этот тип дублированного контента зависит от конкретной страницы и имеет несколько разновидностей. Вот наиболее распространенный:

  • Платные дубликаты кампании , которые также могут быть осложнены несколькими заказами параметров, создавая еще больше дубликатов. Пример: http://www.example.com/directory/?utm_source=google&utm_medium=cpc&utm_campaign=Test&utm_content=TestContent=TestContent
  • Дубликаты пагинации , как правило, для содержимого блога. Пример: http://www.example.com/blog/?page=2
  • Параметры для печати , создание версии страницы, более чистой для печати. Пример: http://www.example.com/page?q=print

6. Печатные каталоги

Это каталогная версия дружественного к принтеру дублирования параметров, например, http://www.example.com/print/page, который вызывает дружественный к принтеру шаблон CSS.

7. Домен против .com / index.html

Домен веб-сайта извлекает свое содержимое из какого-либо индексного файла. Этот тип дублированного контента возникает, когда этот индексный файл также появляется в дикой природе.

8. Дополнительный промежуточный каталог

Это происходит, когда CMS выбрасывает страницу в некое ненужное промежуточное дерево каталогов в дополнение к обычному пути: http://www.example.com/extra-directory/directory/ и http://www.example.com/directory/.

9. Дублированная информация о продукте

Иногда сайты электронной коммерции назначают продукт двум или более категориям, что создает более одной версии URL.

10. Скопированное или синдицированное содержимое

Я сохранил лучшее для последнего: этот тип дублирования контента отличается от перечисленных выше тем, что он происходит вне сайта, что ставит его в область преднамеренного дублирования. Кто-то дословно скопировал ваш текст, и теперь он находится вне вашего контроля (ну, не совсем, но мы вернемся к этому).

Синдицированный контент является наиболее благоприятной формой дублирования вне сайта, когда ваша статья или контент распространяется по нескольким веб-сайтам. Это часто случается с пресс-релизами и новостными статьями.

Более вопиющая форма дублирования вне сайта возникает, когда внешний сайт очищает ваш контент и размещает его на своем домене - часто без зачисления на ваш счет! Иногда это делается с помощью автоматизации, а в других случаях это является результатом кражи особенно ленивым веб-мастером.

И Дубликаты Умножаются!

Образ: Sony Movie Channel

Проблемы с дублирующимся контентом, как правило, взаимодействуют друг с другом, усугубляя проблему на несколько величин. Однажды я провел аудит, в ходе которого у сайта возникли три проблемы с дублированием всего сайта, в результате чего было получено 12 различных дублированных версий всего сайта.

К счастью, дублирующий контент обычно довольно просто исправить, если вы знаете, что нужно исправить.

Работа с дубликатами

Образ: Симпсоны Викия

Итак, теперь, когда вы знаете, что искать, как мы можем найти и исправить эти проблемы с дублированным контентом?

Давайте начнем с некоторого анализа.

Инструменты торговли

  1. Screaming Frog SEO Spider Tool отлично подходит для этой задачи, так как позволяет сканировать ваш сайт и фильтровать дубликаты.
  2. я люблю бегать Аудитор сайта Raven Tools как часть моего первоначального технического анализа и найти несколько говорящих дублирующих сигналов контента таким образом.
  3. Вам также следует проверить раздел «Улучшения HTML» (в разделе «Внешний вид поиска») в Google Search Console Это может указывать на страницы с дублирующимися заголовками или мета-описаниями, что является возможным признаком дублирования контента.
  4. Помимо этого, работает команда сайта в Google может показать вам проиндексированные URL, чтобы вы могли определить проблемные.

Как это исправить

В зависимости от типов дублированного контента, который вы обнаружили, есть несколько различных решений, которые могут применяться. Вот несколько общих подходов:

Канонические метки

Канонические теги должны быть вашей первой линией защиты, и я бы рекомендовал размещать их на каждом сайте. Вот как вы можете застраховаться от сторонних копировальных копий и быть признанным в качестве источника контента.

Канонический тег - это отдельная строка кода, которая находится в разделе <head> HTML-кода вашей веб-страницы. Указывает предпочитаемую вами версию веб-страницы. Пример:

<link rel = "canonical" href = "http://www.arcintermedia.com/" />

Эти теги говорят Google объединить все сигналы ссылки на этот предпочтительный URL-адрес при условии, что канонический тег появляется на всех повторяющихся итерациях. Убедитесь, что, если вы настраиваете канонические теги динамически через WordPress или любую другую CMS, у вас нет канонических значений по умолчанию для любого отображаемого URL. Если вы скажете Google, что все канонично, то нет ничего канонического.

301 перенаправления

301 Redirect - это серверный подход к решению проблем с дублированным содержимым. Для этого вам нужно написать некоторые правила для вашего сервера в отношении обработки различных шаблонов URL, и вам может потребоваться обновить файл .htaccess в зависимости от типа используемого вами сервера.

Перенаправление 301 по сути сообщает серверу, что страница постоянно перемещена, и если кто-то вводит старый URL-адрес, он отправляет его на новый URL-адрес. Этот тип перенаправления невероятно полезен для борьбы с дублированием контента всего сайта, таким как WWW или не WWW, а также помогает устранить 404 страницы ошибок. Я рекомендую сопоставить URL-адреса, которые вы хотите перенаправить на целевые страницы. Это облегчит написание перенаправлений позже.

Для тех, кто работает с менее вовлеченными сайтами, WordPress также имеет несколько полезных плагинов для перенаправления 301. В этом случае вам может не потребоваться испачкать руки при написании правил перенаправления.

Параметры URL консоли поиска Google

Консоль поиска Google может быть очень полезной при работе с дублированием контента на основе параметров. В меню «Сканирование» консоли поиска Google вы найдете раздел «Параметры URL». Здесь вы можете настроить, как Google обрабатывает различные параметры, что позволяет вам быстро отключать дубликаты страниц.

Помните, что функция «Параметры URL» решает только проблемы с дублированием параметров в Google.

Robots.txt

Ваш файл robots.txt представляет собой инь к ян XML вашего Sitemap. В то время как XML-файл Sitemap служит фидом контента, который вы хотели бы видеть индексированным, файл robots.txt представляет собой простой текстовый документ, в котором указано, что следует запретить индексации.

Файл robots.txt может использоваться для запрета индексации дублированных промежуточных каталогов, определенных параметров и может препятствовать индексации любого количества типов дублирующегося контента (при условии, что вы создадите правильный синтаксис с подстановочными знаками). Моз имеет довольно хороший Robots.txt Шпаргалка чтобы помочь вам начать.

Там может быть только один (URL)

Образ: Мерцающий миф

Несмотря на то, что существует множество технических терминов, устранение проблем с дублированием контента на самом деле не должно быть большой головной болью. Самое сложное - идентифицировать дубликаты. Оттуда решения становятся несколько повторяющимися. Вы уменьшаете дубликаты, пока не останется только один URL-путь.

Точно так же, как SEO работает лучше всего, когда он является частью первоначальной сборки сайта, проблемы с дублирующимся контентом лучше всего решаются с помощью профилактики заранее. При создании нового веб-сайта уделите немного времени рассмотрению конструкции URL-адреса и проверьте некоторые из распространенных типов дублирования контента на промежуточном сайте.

А после запуска нового веб-сайта обязательно сразу проведите полный технический аудит. Когда сайт маленький и новый, решить проблемы с дублированием гораздо проще, чем после публикации своей тысячной статьи. Сэкономьте себе судебную работу и планируйте заранее.

Подпишитесь, чтобы получать такой контент в свой почтовый ящик

Похожие

Seo - что это такое?
Seo - что это такое? Сео оптимизация и продвижение сайта Давайте поговорим о том, что такое Seo (Search Engine Optimization), как Seo-оптимизация (внешняя и внутренняя) способна буквально творить чудеса в продвижении сайта и ответить на вопрос, почему не стоит ни в коем случае пренебрегать Seo. Seo - что это такое и как влияет на продвижение вашего сайта. Seo (Search Engine Optimization) - это основное оружие за место в ТОП 10. По большому счету, это искусство попадания
SEO автоматизация или умные инструменты SEO?
... изирован и оставаться на законных основаниях. ОДНАКО, просто потому, что это не может быть полностью автоматизировано, не означает, что многие процессы не могут быть поддержаны с помощью оптимизированных, автоматизированных инструментов . Инструменты - лучший друг SEO. Инструменты позволяют нам использовать способность машины быстро собирать и обрабатывать информацию. То, что мы делаем с этой информацией, - это то, где процесс автоматизации останавливается, и наш интеллект берет
SEO Архивы
... сируемость? Индексируемость - это простота анализа веб-сайта поисковыми системами Интернета (Google, Yahoo, MSN Live ...). Методы оптимизации для поисковых систем (SEO, Search Engine Optimization) должны быть приняты во внимание и необходимы, если мы хотим, чтобы нас знали через Интернет. Если сеть не проиндексирована, она никогда не появится в результатах поисковых систем; и чем выше индексирование, тем более привлекательными будут результаты для пользователей, и у них будет больше
Что такое панировочные сухари?
... или «большой палец», чтобы не потеряться, когда вы заходите в места, которые вы не знали. Таким образом, он всегда мог вернуться, не теряясь в любое время. Как я уже сказал, применительно к компьютерам и, в частности, к веб-страницам, на нашем веб-сайте обязательно есть руководство по навигации по категориям и различным разделам. Теперь, если у вас есть блог в WordPress, вы можете воспользоваться одним из плагинов WordPress, который предлагает
Что такое SEM? Чем не SEM?
Чаще я слышу о SEM. Да, странно, так как я работаю в маркетинговом агентстве с оплатой за клик :). [а не SEM] Однако многие используют эту аббревиатуру, немногие действительно знают значение. Давайте разберемся со специализированной терминологией. Что такое SEM? SEM = поисковый маркетинг;
Что такое SEO и какова цель?
Термин SEO - это термин, используемый в контексте веб-сайтов и цифрового маркетинга, но что на самом деле означает этот термин и почему он так важен для вашего бизнеса? Как насчет этих трех букв, которые вы должны быть в состоянии сделать? Определение SEO - Оптимизация Поисковой машины или на норвежской поисковой оптимизации. SEO основан на Google и других поисковых системах, ранжирующих веб-страницы на основе различных факторов. Эти факторы постоянно меняются и постоянно развиваются.
SEO: Google продвигает Википедию?
... ите и поддержите цифры, британский сайт интересуется актуальностью предоставляемой Википедии в Google информации"> Изучите и поддержите цифры, британский сайт интересуется актуальностью предоставляемой Википедии в Google информации. На панели из 1000 запросов только семь не заходили на сайт на первой странице результатов. Википедия находится на первой странице Google для 99% поисков, в первых пяти
Google может рассматривать перенаправления 308 как редиректы 301
... словам Джона Мюллера из Google, Google может обрабатывать 308 перенаправлений так же, как и 301"> По словам Джона Мюллера из Google, Google может обрабатывать 308 перенаправлений так же, как и 301. Это, конечно, если вы действительно перенаправляете URL на другой. Джон Мюллер из Google сказал о щебет «Если вы используете его [редирект 308] как 301, мы будем относиться к нему как к такому». Google Диск
Влияние Google (не указано) не только на SEO-сайты
... или) в качестве одного из своих 10 лучших ключевых слов только спустя два с половиной месяца после того, как Google внес изменение. С Firefox переходит на безопасный поиск по умолчанию и Google объявили в марте, что безопасный поиск расширится за пределы США Почти наверняка (не
Google Shopping
Для трейдеров нет возможности обойти Google Покупки. Уже не редкость, когда более 50% дохода от рекламы Google генерируется в рекламных кампаниях. Ключевые слова обычно не имеют значения в Google Покупках. Рекламодатели указывают, сколько они готовы заплатить за клик по рекламе продукта, и Google автоматически решает, какие запросы показывают рекламу. В результате высокоприбыльные и менее прибыльные поисковые запросы смешиваются, так что в среднем получается удовлетворительный результат.
Алгоритм Google
О Google Panda Google Panda - это механизм Google, который контролирует качество содержимого сайта. Это также влияет на результаты поиска. Обновление Google Caffeine в августе 2009 года ускорило сканирование и индексацию контента, сделав Google более чувствительным к обновлениям сайта, чтобы пользователи могли быстро догонять свежий контент. Однако более быстрая индексация означает, что сканируется большое количество некачественного или спам-контента, что приводит

Комментарии

У вас может быть отличный контент, но если вы сосредоточитесь на тех же проблемах и той же рубрике, что и другие блоги, что заставит вас выделиться?
У вас может быть отличный контент, но если вы сосредоточитесь на тех же проблемах и той же рубрике, что и другие блоги, что заставит вас выделиться? Зачем кому-то ставить обратную ссылку на ваш сайт, а не другую? В маркетинге это известно как USP, уникальное торговое предложение . Даже если вы называете это по-другому, это не имеет значения. Просто убедитесь, что ваш сайт предлагает то, что другие не делают. Если вы не знаете, как начать, здесь вы найдете
Прогнозирование результатов SEO может быть сложной задачей как для маркетологов, так и для агентств, так как же нам правильно понять выгоды от внедрения плана поисковой оптимизации?
Прогнозирование результатов SEO может быть сложной задачей как для маркетологов, так и для агентств, так как же нам правильно понять выгоды от внедрения плана поисковой оптимизации? Хорошо, чтобы начать, как и любой другой маркетинговый проект, вам нужно знать, где вы были, чтобы знать, куда вы идете. Забавно, что маркетологи, знакомые с традиционными СМИ, могут легко оценить производительность, но когда Поисковая
Ir noluyor burda «означает или что здесь происходит» или «что вы делаете» и «или что вы делаете?
Ir noluyor burda «означает или что здесь происходит» или «что вы делаете» и «или что вы делаете?» Не трать турецкий. Будьте стабильны, делите свою работу на календари, время ожидания, работайте регулярно. Не тратьте целое состояние на Adwords, так как вы думаете, что Google повлияет на ваш рейтинг. Заголовки заголовков должны быть короткими, а их длина не должна превышать 60 символов. Несмотря на то, что это не имеет значения, регулярно вводите порядок
Это может привести к потере одного или двух мест в некоторых местах, но что хорошего в том, что никто не нажимает на (мой) результат поиска?
Это может привести к потере одного или двух мест в некоторых местах, но что хорошего в том, что никто не нажимает на (мой) результат поиска? Однако длина символа заголовка не должна быть слишком длинной и не должна содержать ненужной информации . Максимальное количество символов в результатах поиска большинства поисковых систем (например, Google) - макс. 69 символов ограничено. Все, что приходит потом, более или менее неактуально. Краткое заключение к
Это руководство может быть естественно связано со шлемами магазина, а может быть, даже с другим руководством о том, что следует учитывать при выборе шлема для снегоходов?
Это руководство может быть естественно связано со шлемами магазина, а может быть, даже с другим руководством о том, что следует учитывать при выборе шлема для снегоходов? В дополнение к использованию Google Trends, чтобы выяснить, какие руководства вы можете написать, вы также можете подумать о том, чтобы попытаться использовать ключевые слова в связанных поисках в вашем тексте, заголовке страницы и заголовках. Еще больше связанных ключевых слов могут быть включены
Не каждый вводит те же термины поиска, что и ключевое слово фокуса, так почему бы вам не использовать синонимы?
Не каждый вводит те же термины поиска, что и ключевое слово фокуса, так почему бы вам не использовать синонимы? Латентная семантическая индексация (LSI) - это математический метод, который связывает поисковые термины и значения. Поскольку существует множество способов поиска одной вещи, сделайте свой контент более естественным и менее повторяющимся, используя связанные ключевые слова поиска. Совет: обязательно включите ключевое слово focus в первый абзац вашего текста.
Вы действительно чувствуете, что если SEO не постоят за себя, это может быть конец SEO, как мы его знаем?
Вы действительно чувствуете, что если SEO не постоят за себя, это может быть конец SEO, как мы его знаем? Аарон Уолл: «Я не думаю, что индустрия выросла внезапно, и действительно были статьи о ее неизбежной смерти за годы до того, как я даже вошел в индустрию, поэтому я не думаю, что индустрия умрет быстрой смертью или умрет одновременно. Более вероятно, что люди постепенно маргинализируются, в то время как их прибыль уменьшается, и они теряют личные свободы.
Вы можете добавить проверочный код как во время установки BAVOKO SEO Tools, так и позже в «Настройки» → «Настройки API», нажав кнопку «Еще не подключен к консоли поиска Google?
Вы можете добавить проверочный код как во время установки BAVOKO SEO Tools, так и позже в «Настройки» → «Настройки API», нажав кнопку «Еще не подключен к консоли поиска Google?» И вставив код из тега HTML. там в строке «Проверка сайта тег HMTL». BAVOKO SEO Tools автоматически сохранит код и сгенерирует метатег на ваших страницах. Вернитесь на страницу GSC и завершите настройку, нажав «Подтвердить». 1. Ранжирование анализов с данными из консоли поиска Google в вашем бэкэнде
Если SEO не о создании ссылок, то что такое SEO?
Если SEO не о создании ссылок, то что такое SEO? Поисковая оптимизация - это именно то, что добавила Google в рейтинговую статью. Она касается создания высококачественных веб-сайтов, оптимизированных как для поисковых систем, так и для пользователей. Высококачественный веб-сайт удобен для пользователя, быстр, доступен и предоставляет отличный пользовательский интерфейс независимо от используемой платформы. Важность снова переместилась в
Но как только информация сканируется и индексируется, как Google решает, что показывать в результатах поиска?
Но как только информация сканируется и индексируется, как Google решает, что показывать в результатах поиска? Ответ, конечно, является тщательно охраняемым секретом. То, как поисковая система решает, что отображать, слабо называется ее алгоритмом. Каждая поисковая система использует собственные алгоритмы, которые она разработала, чтобы максимально быстро извлекать наиболее релевантную информацию из своих индексов, чтобы отображать ее так, чтобы ее поисковики-люди сочли ее наиболее полезной.
Так что, если Google не считает слова в статье и использует это как фактор ранжирования, почему исследования предполагают, что более длинные статьи будут иметь более высокий рейтинг?
Так что, если Google не считает слова в статье и использует это как фактор ранжирования, почему исследования предполагают, что более длинные статьи будут иметь более высокий рейтинг? Это из-за других факторов, связанных с более длинными статьями. Более длинные статьи, как правило, содержат более ценную информацию, что делает их более полезными для читателя. И что Google хочет получить наивысший рейтинг на странице? Удобный, популярный контент. Дело не в количестве слов; это то,

Так что же такое дублированный контент?
Насколько плохо?
Но что такое дублированный контент?
Почему это плохо?
И что вы можете с этим поделать?
Так что же такое дублированный контент?
Насколько плохо?
Com/directory/?
Com/blog/?
Com/page?