Сышышь ты, выходи сюда,
поговорим !

Дакумент фармату PDF і яго індэксацыя пошукавымі сістэмамі

Версія для друку   Фармат PDF быў распрацаваны фірмай Adobe Systems, каб вырашыць праблему адзінства адлюстравання і апрацоўкі паліграфічнай прадукцыі ў розных інфармацыйных асяроддзях (яго кросплатформеннасць) і даволі паспяхова спраўляецца з гэтай задачай і па сённяшні дзень Версія для друку

Фармат PDF быў распрацаваны фірмай Adobe Systems, каб вырашыць праблему адзінства адлюстравання і апрацоўкі паліграфічнай прадукцыі ў розных інфармацыйных асяроддзях (яго кросплатформеннасць) і даволі паспяхова спраўляецца з гэтай задачай і па сённяшні дзень Фармат PDF быў распрацаваны фірмай Adobe Systems, каб вырашыць праблему адзінства адлюстравання і апрацоўкі паліграфічнай прадукцыі ў розных інфармацыйных асяроддзях (яго кросплатформеннасць) і даволі паспяхова спраўляецца з гэтай задачай і па сённяшні дзень. Аднак з часам у гэтага фармату з'явілася і іншае прызначэнне. Універсальнасць гэтага фармату справакавала рост яго папулярнасці, а, такім чынам, павялічылася і колькасць публікацый, даступных у гэтым фармаце ў электронным выглядзе ў Інтэрнэце.

Першапачаткова файлы фармату PDF ў свядомасці многіх людзей асацыяваліся менавіта з якасным унікальным кантэнтам, т. К. З яго дапамогай часта публікаваліся і публікуюцца розныя справаздачы, даклады, артыкулы, кіраўніцтва і іншая карысная інфармацыя. Вядома, было б па-дурному выпускаць такі крыніца карыснай інфармацыі. З часам усе папулярныя пошукавыя сістэмы навучыліся індэксаваць файлы PDF і ранжыраваць іх, што аўтаматычна паставіла іх нароўні з звыклымі для нас файламі ў фармаце HTML (вэб-старонкамі).

Нам жа важна не ўпусціць магчымую выгаду і навучыцца правільна аптымізаваць файлы падобнага роду для пошукавых сістэм, каб забяспечыць іх лепшую бачнасць ў выніках пошуку. Доўгі час файлы PDF ўспрымаліся выключна як файлы-архівы, для адкрыцця якіх неабходна было іх загружаць на кампутар і чытаць у іншай праграме (Напрыклад, у Adobe Reader - праграме для прагляду фармату PDF). Так было раней, цяпер жа многае мяняецца: значна павялічваюцца хуткасці Інтэрнэту, з'яўляюцца убудаваныя ў браўзэр убудовы для чытання фармату PDF, якія дазваляюць праглядаць файлы адразу ж у браўзэры. Напрыклад, ужо сёння ў браўзэры Opera можна чытаць файлы PDF прама на сайце анлайн. А гэта ўсё прамое сведчанне таго, што папулярнасць гэтага фармату ў агляднай будучыні будзе толькі расці. Гэта зараз не толькі універсальны фармат для захоўвання і рэдагавання паліграфіі, але таксама і спосаб перадачы інфармацыі ў Інтэрнэце (які выконвае функцыі звычайнай вэб-старонкі).

У гэтым артыкуле я стараўся сістэматызаваць інфармацыю, асвятліўшы як мага больш фактаў, якія ўплываюць на індэксацыю пошукавымі сістэмамі дакументаў гэтага фармату ў Інтэрнэце, а таксама адказаўшы на самыя распаўсюджаныя пытанні, якія ўзнікаюць у вэб-майстроў, якія выкарыстоўваюць гэтыя файлы на сваіх сайтах.

Любы вэб-майстар і seo-аптымізатар павінен разумець, што файл PDF - гэта такая ж старонка сайта, як і файл у фармаце HTML. Як правіла, на гэты файл спасылаюцца так, што ён з'яўляецца тупіковай для пошукавай сістэмы, т. К. У ім амаль ніколі не ўтрымліваюцца спасылкі на іншыя старонкі сайта, а дарма. Кожны PDF-файл (як і старонка HTML) знаходзіцца ў індэксе пошукавых сістэм, такім чынам, мае і свой пошукавы вага, які перадаецца па спасылках (вИЦ або PR, калі хочаце). Я настойліва рэкамендую вам у любым файле PDF, выкладзеным на сайце, рабіць спасылкі на звычайныя HTML-старонкі сайта і на іншыя старонкі PDF (можна нават прадубляваць навігацыю асноўнага сайта). У дадзеным выпадку вы будзеце толькі ў выйгрышным становішчы, т. К. Акрамя перадачы пошукавага вагі па спасылцы, наведвальнік, запампаваўшы файл PDF з вашага сайта і азнаёміўшыся з інфармацыяй у ім, можа да вас вярнуцца, пстрыкнуўшы па спасылцы, якая вядзе на ваш сайт з запампаванага дакумента. Да таго ж файл PDF рэдка рэдагуецца, таму часта захоўваецца ў першапачатковым выглядзе, а таксама як файлавы архіў можа імкліва распаўсюджвацца праз розныя файлавыя хостынгі, а гэта, зноў жа, новыя карыстальнікі для вашага сайта (той рэдкі выпадак, калі пошукавая аптымізацыя напрамую ўплывае на непоисковое прасоўванне).

ПРАГРАМЫ ДЛЯ працы з файламі PDF

Для стварэння файлаў PDF выкарыстоўвайце праграму Adobe Acrobat, т. К. Яна мае Для стварэння файлаў PDF выкарыстоўвайце праграму Adobe Acrobat, т цэлы арсенал сродкаў, якія здольныя максімальна якасна аптымізаваць нашы файлы. Нягледзячы на ​​гэта, можна (але не рэкамендуецца) выкарыстоўваць і іншыя праграмы. Напрыклад, для стварэння файлаў PDF вы можаце выкарыстоўваць нізку праграм Adobe Pagemaker і Adobe InDesign або тэкставыя рэдактары накшталт Word з пакета Microsoft Office або Write - з OpenOffice. Калі будзеце выкарыстоўваць тэкставы рэдактар ​​Word для стварэння дакумента фармату PDF, то выкарыстоўвайце тэгі H1, H2, H3 і іншыя падобныя для аптымізацыі тэксту дакумента. Вы павінны зрабіць атрыманы тэкст базуецца на мове HTML, каб пошукавыя сістэмы эфектыўна яго індэксавалі.

Не выкарыстоўвайце праграмы тыпу Photoshop і Illustrator, т. К. Пасля апрацоўкі дакумента на выхадзе інфармацыя ператвараецца ў адно вялікае выява, тэкст на якім не распазнаць пошукавым сістэмам. Аднак часта здараецца і тое, што ў вэб-майстра ўжо ёсць вялікая колькасць PDF-файлаў, атрыманых ад заказчыка, ці ж спецыфіка тэмы на сайце такая, што па ёй ёсць інфармацыя ў электронным выглядзе толькі ў гэтым фармаце. Калі ў вас менавіта такі выпадак, то не адчайвайцеся. Цяпер актыўна распрацоўваюцца праграмы, здольныя распазнаваць тэкст на малюнках, што дазваляе мадыфікаваць тэкст на малюнках ў звычайны тэкст, які індэксуецца пошукавымі сістэмамі. У Расіі даволі паспяхова распазнаннем тэкстаў займаецца кампанія ABYY. Да прыкладу, вы можаце скарыстацца іх канвертарам Abbyy PDF Transformer. Хачу адразу заўважыць, што гэта даволі унікальны прадукт, аналагаў якому амаль няма. У яго магчымасці ўваходзіць канвертаванне тэксту на малюнках PDF ў тэкст, здольны індэксавацца пошукавымі сістэмамі.

Некалькі слоў, я думаю, можна сказаць і пра праграмы канвертары. Калі ж вы вырашылі, што па нейкіх прычынах фармат PDF на сайце вас не вельмі задавальняе, а кантэнт вашага сайта складаецца, у асноўным, з файлаў PDF, то ў вас ёсць магчымасць переконвертировать гэтыя файлы ў фармат HTML, выкарыстоўваючы розныя бясплатныя і платныя PDF канвертары.

Вось невялікі спіс такіх канвэртарам:

  • Advanced PDF to HTML
  • Comfortable PDF to HTML
  • Easy PDF to HTML
  • Adobe Acrobat Pro Extended - гэта канвэртар кампаніі Adobe, але вядома, што аптымізатары адчуваюць складанасці з гэтай праграмай.

Зараз, я думаю, самы час падзяліцца з вамі сакрэтамі аптымізацыі файла PDF для пошукавых сістэм.

Выявы

Не выкарыстоўвайце занадта шмат малюнкаў або малюнкі вялікага памеру. Малюнкі хоць і паляпшаюць знешні выгляд, аднак таксама павялічваецца памер файла і час яго загрузкі. Як і на HTML-старонцы, калі вы паставіце шмат малюнкаў (асабліва неоптимизированных), то гэта запатрабуе больш часу для іх загрузкі ў браўзэр. Але акрамя аптымізацыі памеру малюнкаў PDF-дакумента, неабходна таксама аптымізаваць і подпісы (альтэрнатыўны тэкст) да іх. У кожнага малюнка дакумента павінна быць свая подпіс, як да малюначкаў звычайнай HTML-старонкі.

Памер файла

Трэба заўсёды памятаць, што пошукавыя сістэмы не індэксуюць файлы, якія занадта шмат важаць. Напрыклад, пошукавая сістэма "Яндэкс" не будзе індэксаваць файлы вагой больш, чым 10 Мб, адсюль вынікае правіла, што файл PDF не можа быць больш за 10 Мб.

Калі казаць пра аптымальны памер PDF-файла, то многія seo -оптимизаторы лічаць яго велічыню ў межах 500 - 1000 Кб, т. К. З файламі менавіта такіх памераў адбываецца менш за ўсё памылак, звязаных з індэксацыяй файлаў.

Для аптымізацыі памеру ў праграме Adobe Acrobat ёсць спецыяльная функцыя: Advanced> PDF Optimizer.

Увага! Пры стварэнні PDF-дакумента ў любым рэдактары звяртайце ўвагу на версію атрымоўванага файла. Рэкамендуемая версія - 1.5 і ніжэй, т. К. Такі файл гарантавана будзе чытацца усімі праграмамі для прагляду PDF і робатамі пошукавых сістэм. Фармат PDF дазваляе аптымізаваць таксама і копію дакумента, таму па магчымасці Аптымізуе і яе.

ТЭКСТ файлах

Старайцеся пазбягаць вялікай колькасці тэксту ў адным файле PDF, ікрышыце адзін файл на некалькі файлаў, прычым, Лінк іх спасылкамі ўнутры кожнага такога дакумента (так, як бы вы гэта рабілі са звычайнымі HTML-дакументамі).

Аптымізуе тэкст файла PDF пад канкрэтныя ключавыя запыты, а тут трэба надаваць увагу такім жа паказчыках, як і на звычайнай вэб-старонцы (шчыльнасць ключавых слоў не вышэй за 5% і іншым). Калі вы хочаце атрымаць добра индексируемый і рэлевантны пошукавых запытах кантэнт PDF-дакумента, вы павінны старацца пазбягаць нагрувашчвання старонак у ім. Пры ўнутранай аптымізацыі тэксту, а менавіта: загалоўкаў і падзагалоўкам, ключавых слоў і фраз, неабходных для вашага дакумента, - будзьце вельмі асцярожныя, каб файл не выглядаў заспамленной і ня вылецеў, у выніку, з індэкса пошукавых сістэм.

Калі ваш файл PDF пабіты на некалькі частак, то наладзьце парадак адлюстравання гэтых частак. Ад парадку чытання дакумента залежыць тое, якая інфармацыя будзе прадастаўлена пошукаваму робату спачатку, а якая - потым. Памятаеце, што найбольшую пошукавую значнасць маюць ключавыя словы, якія знаходзяцца бліжэй да пачатку дакумента, таму калі ў дакуменце адваротнае, то вам варта перабудаваць лагічную паслядоўнасць частак вашага PDF дакумента, каб вылучыць найбольш важныя часткі і палепшыць іх пошукавую бачнасць у Інтэрнэце.

Зрабіце змест (пошукавую карту дакумента), кожны пункт гэтага зместа аформіце спасылкай (закладкай) усярэдзіне PDF дакумента, для кожнай спасылкі прапішіце ключавыя словы ў апісанні спасылкі. Гэты прыём найбольш эфектыўны для дакументаў, якія складаюцца з некалькіх лагічны частак і з вялікай колькасцю старонак - ён забяспечвае якасную ўнутраную перелинковку дакумента, якая дазваляе эфектыўна індэксаваць дакумент пошукавым робатам.

Калі вы хочаце стварыць даведнік, кіраўніцтва або іншы дакумент, які прадугледжвае вялікі аб'ём інфармацыі ў адным файле, то я рэкамендую ствараць падобныя дакументы ў фармаце DjV u. Старонкі дакументаў (кантэнт) у гэтым фармаце не індэксуюцца пошукавымі сістэмамі. Але калі па нейкіх прычынах ў вас не атрымліваецца паменшыць памер PDF-файлаў і разбіць іх на некалькі асобных файлаў, то можна скарыстацца вельмі зручнай функцыяй у праграме Adobe Reader - Optimize for Fast Web View, якая дазваляе праглядаць ўжо загрузяць старонкі дакумента, не чакаючы яго канчатковай загрузкі. Гэта зручна для тых карыстальнікаў, хто будзе праглядаць ваш PDF-файл непасрэдна на вашым сайце ў рэжыме онлайн.

ДАДАТКОВАЯ ІНФАРМАЦЫЯ (метаполы)

Вельмі важна запоўніць усю дадатковую інфармацыю аб вашым файле PDF. Надасце асаблівую ўвагу такім тэгах як: Title (загаловак), Author (аўтар матэрыялу), Subject (тэма), Keywords (ключавыя словы дакумента), Descriptions (апісанне PDF-дакумента) і Copyright (аўтарскія правы). Усе гэтыя налады можна знайсці ў праграме Adobe Acrobat ў меню File> Document Properties. Метададзеныя файла PDF маюць падобнае паходжанне з метатега файлаў HTML, так што надавайце ім асаблівую ўвагу пры аптымізацыі.

Кадоўкі, шрыфт і размяшчэнне файлаў

Некалькі слоў трэба сказаць і пра аптымізацыю шрыфтоў. Не забывайце ўключаць у сам файл усе неабходныя (нестандартныя) шрыфты. Даволі часта для дэкаратыўных мэтаў выкарыстоўваюцца самыя разнастайныя і рэдкія паліграфічныя шрыфты, якія могуць дрэнна ўспрымацца пошукавымі сістэмамі, таму, па магчымасці, старайцеся карыстацца стандартнымі шрыфтамі (Arial, Helvetica, Sans-Serif, Times New Roman і іншымі), якія добра індэксуюцца пошукавымі сістэмамі . Іх плюс у тым, што яны прысутнічаюць па змаўчанні ў любой аперацыйнай сістэме, таму з дакумента PDF іх можна спакойна выключыць, што зменшыць памер файла.

Шрыфты, якія не былі дададзеныя ў PDF-дакумент або адсутнічаюць ў аперацыйнай сістэме, будуць адлюстроўвацца тым шрыфтам, які маецца (самым блізкім па значэнні), што можа прывесці да непажаданых наступстваў, а менавіта да павелічэння або памяншэння колькасці старонак, колькасці знакаў у радках , міжрадковага інтэрвалу і іншых праблем метрыкі.

Даволі балючы параметр для пошукавых сістэм - кадоўка файла. Калі пошукавая сістэма не здолее вызначыць кадыроўку вашага PDF файла самастойна, то дакумент наогул не будзе праіндэксаваны, таму заўсёды правярайце, паказаная Ці яна. Пажадана выкарыстоўваць самыя вядомыя і папулярныя кадоўкі.

Ваш файл PDF, як і звычайная старонка файла, павінен быць максімальна блізкі да кораня сайта. Спасылайцеся на іх бліжэй да галоўнай старонцы, не спрабуйце засунуць яго глыбока ў структуру сайта, каб не панізіць пошукавую значнасць вашага PDF дакумента.

Не давайце вашых дакументах у фармаце PDF занадта складаныя імёны. Спрашчае іх. Некалькі слоў у назве самага файла падзяляюцца знакам "_". Напрыклад: imya_documenta.pdf. Таксама для падзельніка можна выкарыстоўваць і сімвал "-", але я рэкамендую выкарыстоўваць першы варыянт.

Пасля ўсіх праведзеных аперацый па аптымізацыі можаце выкладваць файл на сайт. Пошукавыя сістэмы знойдуць файл, праіндэксуюць яго і пачнуць выводзіць ў выніках пошуку, і калі матэрыял цікавы, пачнецца самораскрутка яго сярод наведвальнікаў - на файл пачнуць спасылацца, спампоўваць і публікаваць яго ў іншых месцах (а сам файл будзе з спасылкамі на ваш сайт). Нядрэнна, ці не праўда?

Напрыканцы, падам вам пару спасылак, якія могуць быць карысныя ў сувязі з апублікаваным матэрыялам:

http://ru.wikipedia.org/wiki/PDF - агульная інфармацыя аб файле PDF
http://get.adobe.com/reader/ - апошняя версія Adobe Reader
http://www.adobe.com/products/acrobat/ - апошняя версія Adobe Acrobat
http://www.abbyy.ru/pdftransformer/ - апошняя версія Abbyy PDF Transformer
http://www.taurion.ru/acrobat - дапаможнік працы ў праграме Adobe Acrobat

У гэтым аглядзе я пастараўся адказаць на найважнейшыя пытанні па аптымізацыі файла PDF, якія задаюць людзі, якія займаюцца раскруткай сайтаў. Але калі ў вас з'явіліся пытанні ці нешта засталося незразумелым, то, калі ласка, паведамляйце пра гэта! Буду рады любым водгуках ад вас! Дзякуй!



Перайсці ў пачатак старонкі
Перайсці ў пачатак старонкі   Падабаецца гэты блог Падабаецца гэты блог?
Падпішыцеся на абнаўлення блога (RSS)
.
Падпішыцеся на каментары (RSS) .

Нядрэнна, ці не праўда?