Сышышь ты, выходи сюда,
поговорим !

Дублі старонак у Joomla - прычыны, памылкі і рашэнні

  1. Так як жа пошукавыя сістэмы знаходзяць дублі старонак?
  2. Навошта трэба пазбаўляцца ад дубляў старонак?
  3. 5 шляхоў збавення ад дубляў старонак
  4. 1. Robots.txt для Joomla
  5. 2. Redirect 301
  6. 3. Мета-тэг Robots
  7. 4. Выдаляны URL з панэлі Вэбмайстра
  8. 5. Тэг X-Robots-Tag
  9. заключэнне

Такім чынам, дублі - гэта ідэнтычныя дакументы на вашым сайце, якія даступныя праз розныя URL

Такім чынам, дублі - гэта ідэнтычныя дакументы на вашым сайце, якія даступныя праз розныя URL. На самай справе дублі старонак з'яўляюцца слабым месцам любой CMS, не толькі Joomla. Усе гэтыя старонкі бясшкодныя, пакуль не будуць праіндэксаваныя пошукавай сістэмай. Самае галоўнае, сачыць за індэксацыяй і адразу ж прадпрымаць дзеянні па выдаленні такіх старонак з вынікаў пошуку, але яшчэ лепш загадзя прадумаць структуру сайта і такім чынам пазбегнуць такіх сітуацый.

Самай галоўнай прычынай з'яўлення дубляў з'яўляецца няправільная структура вэб-сайта. Перш за ўсё, вам неабходна прадумаць іерархію катэгорый і пунктаў меню. Калі вы ствараеце некалькі катэгорый загадзя, то гэта дапаможа пазбегнуць дубляў старонак у будучыні.

Давайце паглядзім на самыя распаўсюджаныя памылкі. Выкажам здагадку, у вас ёсць катэгорыя "News" і ў яе ёсць некалькі матэрыялы па тэме: - "Politics", "Economy", і г.д., і ўсе матэрыялы вы прывязваеце да даччыных катэгорыям. Калі вы створыце пункты меню толькі для матэрыялы па тэме, напрыклад "Politics", то спасылкі (дл матэрыялаў) могуць быць такімі:

https://website.com/politics/23-material https://website.com/1-news/politics/23-material https://website.com/1-news/2-politics/23-material https : //website.com/index.php? option = com_content & task = view & id = 23 & Itemid = 1

І гэтак далей і таму падобнае - у вас з'явяцца розныя магчымасці фарміравання url, і ўсе яны будуць проста копіямі адной старонкі. Гэта прыклад таго, як гэта не павінна быць. Акрамя таго, пошукавыя сістэмы могуць індэксаваць тэхнічныя копіі, якія даступныя праз спасылкі "Print", "PDF", "Send to afriend".

Вы павінны прадумаць структуру і вызначыць галоўныя катэгорыі і падкатэгорыі ўжо на старце стварэння вашага вэб-сайта. З ростам вашага рэсурсу няма неабходнасці ў змене існуючай структуры, проста дадайце дадатковыя раздзелы. Рэструктурызацыя вашага сайта на піку распрацоўкі будзе проста правалам. Да таго ж, некаторыя старонкі (а ў дрэнным выпадку ўсё) зменяць свае адрасы, што прывядзе да сур'ёзнай страты пазіцый у выніках пошуку і наведванняў.

Так як жа пошукавыя сістэмы знаходзяць дублі старонак?

Самая распаўсюджаная прычына - гэта пашырэння, якія ўсталёўваюцца на вэб-сайты Joomla. Прыклад - навіннай модуль на галоўнай старонцы можа выдаць розныя адрасы. Часам такія дублі старонак відаць нават у карце сайта, напрыклад, калі ў вас усталяваны кампанент Xmap.

Калі ваш сайт ужо праіндэксаваны, то не так складана знайсці дубляваны кантэнт, проста скапіруйце некалькі унікальных тэкстаў са старонкі і ўстаўце гэты матэрыял (у двукоссі) у пошук Google. Калі сайт не праіндэксаваны, то вы можаце паспрабаваць XENU (У выпадку, калі ваш сайт не вельмі вялікі).

Навошта трэба пазбаўляцца ад дубляў старонак?

Пошукавым сістэмам не падабаецца, і яны не спрабуюць праіндэксаваць вэб-сайты з вялікай колькасцю ідэнтычных старонак, так як іх неабходнасць у пошуку становіцца пад пытаннем. Пры аптымізацыі старонак пад пэўныя ключавыя словы выбіраюцца найбольш рэлевантныя старонкі, і кантэнт аптымізуецца для іх. Калі такія старонкі маюць дублі, то падчас абнаўлення пошукавыя сістэмы могуць замяніць рэлевантныя старонкі іх дублямі (гэта суправаджаецца рэзкім падзеннем у пазіцыях і паніжэннем трафіку).

5 шляхоў збавення ад дубляў старонак

Кожны суб'ект (вэб-сайт) унікальны, давайце разгледзім найбольш папулярныя метады, якія спрацоўваюць у 99% выпадкаў. Выбераце адзін з гэтых спосабаў або выкарыстоўвайце іх у комплексе. Увогуле-то, гэтыя рашэнні могуць быць ужытыя да любой іншай CMS.

Усе гэтыя прыклады валіднай, калі вы ўключылі стандартны SEF і перанакіраванне старонак у агульных наладах.

1. Robots.txt для Joomla

Гэты файл уключаны ў стандартны пакет Joomla, размешчаны ў каранёвай дырэкторыі і даступны па адрасе yourwebsite.com/robots.txt. Ён паказвае пошукавым сістэмам, як індэксаваць ваш вэб-сайт. З яго дапамогай вы можаце зачыніць пэўныя часткі вашага сайта. Дадаткова вы можаце выкарыстоўваць наступную інструкцыю для дадзеных па змаўчанні:

Disallow: / *? # Любая спасылка, якая змяшчае гэты знак, не будзе праіндэксавана *

Усяго толькі адзін радок выратавала вас ад захавання такога смецця, як:

  • старонкі для друку;
  • спасылкі на rss стужкі;
  • старонка вынікаў пошуку па сайце;
  • таксама закрые пастаронкавага навігацыю;
  • а таксама многія іншыя варыянты, у залежнасці ад выкарыстоўваных пашырэнняў.

Выкарыстоўваць гэты радок ці не, вырашаць вам, але заўсёды памятайце, што занадта вялікі файл robots лічыцца цалкам рарешающим. Звярніце ўвагу на тое, што гэтая радок не павінна перакрываць нешта важнае, тыпу карты сайта, таму вы можаце проста дадаць радок Allow: / sitemap.

2. Redirect 301

Redirect 301 падыходзіць для выпадкаў, калі вы памянялі адрасы, а дакументы ўсё яшчэ існуюць. У гэтым выпадку для правільнай прывязкі вам неабходна выкарыстоўваць redirect 301 ў файле .htaccess. Такім чынам пошукавыя сістэмы зразумеюць, што дакумент перамешчаны па новым адрасе. Гэты метад дазваляе захаваць як наведвальнасць, так і PR.

301 redirect можа таксама выкарыстоўвацца для склейвання дубляў старонак. Напрыклад, шырока выкарыстоўваюцца дублі галоўнай старонкі на Joomla сайтах: /index.php і аліяс меню Home, напрыклад / home або / homepage. Яны могуць быць даволі проста злепленыя - адкрыйце ваш файл .htaccess і ўвядзіце:

Redirect 301 /index.php http://site.com/

... ці вы таксама можаце зрабіць redirect 301 ў index.php файле вашага пра шаблон:

<? Php if ($ _SERVER [ 'REQUEST_URI'] == '/index.php') {header ( "Location: /", TRUE, 301); exit (); }?>

Вось класічны прыклад url c і без www:

RewriteEngine On RewriteCond% {HTTP_HOST} ^ www.example.com $ [NC] RewriteRule ^ (. *) $ Http://example.com/$1 [R = 301, L]

тут вы зможаце знайсці разлиные варыянты выкарыстання redirect 301.

3. Мета-тэг Robots

Яшчэ адзін з варыянтаў прадухілення індэксавання дубляў старонак - выкарыстоўваць мета тэг robots:

<Meta name = "robots" content = "noindex" />

На дадзены момант гэтая опцыя нашмат лепш для Google, чым выкарыстанне інструкцый у файле robots.txt. Напрыклад, для закрыцця старонак вынікаў пошуку вам неабходна дадаць у <head> </ head> наступны код:

<? Php $ option = JFactory :: getApplication () -> input-> getCmd ( 'option', ''); if ($ option == 'com_search'):?&gt; <meta name = "robots" content = "noindex" /> <? php endif; ?>

4. Выдаляны URL з панэлі Вэбмайстра

Яшчэ адзін шлях па збавенні ад дубляў - гэта выдаляць іх уручную з панэлі вэбмайстра, для Google:

https://www.google.com/webmasters/tools/home?hl=ru

5. Тэг X-Robots-Tag

Google рэкамендуе выкарыстоўваць тэг X-Robots-Tag ў якасці альтэрнатывы чацвёртага метаду.

HTTP / 1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT ... X-Robots-Tag: noindex ...

заключэнне

Як вы бачыце, існуе мноства шляхоў па ліквідацыі дубляў. Вывучыце іх і абярыце для сябе самы прыдатны. Таксама наведайце дбаў Пошукавая аптымізацыя, прасоўванне сайтаў на Joomla (SEO) на joomlaforum.ru - там вы знойдзеце шмат карыснай інфармацыі на гэтую тэму.

Так як жа пошукавыя сістэмы знаходзяць дублі старонак?
Навошта трэба пазбаўляцца ад дубляў старонак?
Php?
Так як жа пошукавыя сістэмы знаходзяць дублі старонак?
Навошта трэба пазбаўляцца ад дубляў старонак?
Php if ($ _SERVER [ 'REQUEST_URI'] == '/index.php') {header ( "Location: /", TRUE, 301); exit (); }?
Php $ option = JFactory :: getApplication () -> input-> getCmd ( 'option', ''); if ($ option == 'com_search'):?
Gt; <meta name = "robots" content = "noindex" /> <?
Php endif; ?
Com/webmasters/tools/home?