Сышышь ты, выходи сюда,
поговорим !

Документ формату PDF і його індексація пошуковими системами

Версія для друку   Формат PDF був розроблений фірмою Adobe Systems, щоб вирішити проблему єдності відображення і обробки поліграфічної продукції в різних інформаційних середовищах (його кроссплатформенность) і досить успішно справляється з цим завданням і по сьогоднішній день Версія для друку

Формат PDF був розроблений фірмою Adobe Systems, щоб вирішити проблему єдності відображення і обробки поліграфічної продукції в різних інформаційних середовищах (його кроссплатформенность) і досить успішно справляється з цим завданням і по сьогоднішній день Формат PDF був розроблений фірмою Adobe Systems, щоб вирішити проблему єдності відображення і обробки поліграфічної продукції в різних інформаційних середовищах (його кроссплатформенность) і досить успішно справляється з цим завданням і по сьогоднішній день. Однак з часом у цього формату з'явилося і інше призначення. Універсальність цього формату спровокувала зростання його популярності, а, отже, збільшилася і кількість публікацій, доступних в цьому форматі в електронному вигляді в Інтернеті.

Спочатку файли формату PDF в свідомості багатьох людей асоціювалися саме з якісним унікальним контентом, т. К. С його допомогою часто публікувалися і публікуються різні звіти, доповіді, статті, керівництва та інша корисна інформація. Звичайно, було б нерозумно упускати такий джерело корисної інформації. Згодом всі популярні пошукові системи навчилися індексувати файли PDF і ранжувати їх, що автоматично поставило їх нарівні зі звичними для нас файлами в форматі HTML (веб-сторінками).

Нам же важливо не прогаяти можливу вигоду і навчитися правильно оптимізувати файли подібного роду для пошукових систем, щоб забезпечити їх кращу видимість в результатах пошуку. Довгий час файли PDF сприймалися виключно як файли-архіви, для відкриття яких необхідно було їх завантажувати на комп'ютер і читати в сторонньої програмою (Наприклад, в Adobe Reader - програму для перегляду формату PDF). Так було раніше, зараз же багато чого змінюється: значно збільшуються швидкості Інтернету, з'являються вбудовані в браузер плагіни для читання формату PDF, що дозволяють переглядати файли відразу ж в браузері. Наприклад, вже сьогодні в браузері Opera можна читати файли PDF прямо на сайті онлайн. А це все пряме свідчення того, що популярність цього формату в доступному для огляду майбутньому буде тільки зростати. Це тепер не тільки універсальний формат для зберігання і редагування поліграфії, але також і спосіб передачі інформації в Інтернеті (виконує функції звичайної веб-сторінки).

У цій статті я намагався систематизувати інформацію, освітивши якомога більше фактів, що впливають на індексацію пошуковими системами документів цього формату в Інтернеті, а також відповівши на найпоширеніші питання, які виникають у веб-майстрів, які використовують ці файли на своїх сайтах.

Будь-який веб-майстер і seo-оптимізатор повинен розуміти, що файл PDF - це така ж сторінка сайту, як і файл у форматі HTML. Як правило, на цей файл посилаються так, що він є тупиковим для пошукової системи, т. К. В ньому майже ніколи не містяться посилання на інші сторінки сайту, а даремно. Кожен PDF-файл (як і сторінка HTML) знаходиться в індексі пошукових систем, отже, має і свій пошуковий вага, який передається по посиланнях (віц або PR, якщо хочете). Я настійно рекомендую вам в будь-якому файлі PDF, викладеним на сайті, робити посилання на звичайні HTML-сторінки сайту і на інші сторінки PDF (можна навіть продублювати навігацію основного сайту). В даному випадку ви будете тільки в виграшному становищі, т. К. Крім передачі пошукового ваги за посиланням, відвідувач, скачавши файл PDF з вашого сайту і ознайомившись з інформацією в ньому, може до вас повернутися, клацнувши по посиланню, що веде на ваш сайт з завантаженого документа. До того ж файл PDF рідко редагується, тому часто зберігається в первісному вигляді, а також як файловий архів може стрімко поширюватися через різні файлові хостинги, а це, знову ж таки, нові користувачі для вашого сайту (той рідкісний випадок, коли пошукова оптимізація безпосередньо впливає на непоісковой просування).

ПРОГРАМИ ДЛЯ РОБОТИ З ФАЙЛАМИ PDF

Для створення файлів PDF використовуйте програму Adobe Acrobat, т. К. Вона має Для створення файлів PDF використовуйте програму Adobe Acrobat, т цілий арсенал засобів, які здатні максимально якісно оптимізувати наші файли. Незважаючи на це, можна (але не рекомендується) використовувати і інші програми. Наприклад, для створення файлів PDF ви можете використовувати зв'язку програм Adobe Pagemaker і Adobe InDesign або текстові редактори на кшталт Word з пакету Microsoft Office або Write - з OpenOffice. Коли будете використовувати текстовий редактор Word для створення документа формату PDF, то використовуйте теги H1, H2, H3 і інші подібні для оптимізації тексту документа. Ви повинні зробити отриманий текст базується на мові HTML, щоб пошукові системи ефективно його індексували.

Не використовуйте програми типу Photoshop і Illustrator, т. К. Після обробки документа на виході інформація перетворюється в одне велике зображення, текст на якому не розпізнати пошуковим системам. Однак часто трапляється і те, що у веб-майстри вже є велика кількість PDF-файлів, отриманих від замовника, або ж специфіка теми на сайті така, що по ній є інформація в електронному вигляді тільки в цьому форматі. Якщо у вас саме такий випадок, то не впадайте у відчай. Зараз активно розробляються програми, здатні розпізнавати текст на зображеннях, що дозволяє модифікувати текст на зображеннях в звичайний текст, який індексується пошуковими системами. У Росії досить успішно розпізнаванням текстів займається компанія ABYY. Наприклад, ви можете скористатися їх конвертером Abbyy PDF Transformer. Хочу відразу зауважити, що це досить унікальний продукт, аналогів якому майже немає. В його можливості входить конвертування тексту на картинках PDF в текст, здатний індексуватися пошуковими системами.

Кілька слів, я думаю, можна сказати і про програми конвертери. Якщо ж ви вирішили, що з якихось причин формат PDF на сайті вас не дуже влаштовує, а контент вашого сайту полягає, в основному, з файлів PDF, то у вас є можливість переконвертувати ці файли в формат HTML, використовуючи різні безкоштовні і платні PDF конвертери.

Ось невеликий список таких конвертерів:

  • Advanced PDF to HTML
  • Comfortable PDF to HTML
  • Easy PDF to HTML
  • Adobe Acrobat Pro Extended - це конвертер компанії Adobe, але відомо, що оптимізатори зазнають труднощів з цією програмою.

Тепер, я думаю, саме час поділитися з вами секретами оптимізації файлу PDF для пошукових систем.

ЗОБРАЖЕННЯ

Не використовуйте занадто багато зображень або зображення великого розміру. Картинки хоч і покращують зовнішній вигляд, однак також збільшується розмір файлу і час його завантаження. Як і на HTML-сторінці, якщо ви поставите багато зображень (особливо неоптимізованих), то це зажадає більше часу для їх завантаження в браузер. Але крім оптимізації розміру зображень PDF-документа, необхідно також оптимізувати і підписи (альтернативний текст) до них. У кожного зображення документа повинна бути своя підпис, як до картинок звичайної HTML-сторінки.

РОЗМІР ФАЙЛУ

Потрібно завжди пам'ятати, що пошукові системи не індексують файли, які занадто багато важать. Наприклад, пошукова система "Яндекс" НЕ буде індексувати файли вагою більше, ніж 10 Мб, звідси випливає правило, що файл PDF не може бути більше 10 Мб.

Якщо говорити про оптимальний розмір PDF-файлу, то багато seo -оптімізатори вважають його величину в межах 500 - 1000 Кб, т. К. С файлами саме таких розмірів відбувається найменше помилок, пов'язаних з індексацією файлів.

Для оптимізації розміру в програмі Adobe Acrobat є спеціальна функція: Advanced> PDF Optimizer.

Увага! При створенні PDF-документа в будь-якому редакторі звертайте увагу на версію одержуваного файлу. Рекомендована версія - 1.5 і нижче, т. К. Такий файл гарантовано буде читатися усіма програмами для перегляду PDF і роботами пошукових систем. Формат PDF дозволяє оптимізувати також і копію документа, тому по можливості оптимізуйте і її.

ТЕКСТ ФАЙЛА

Намагайтеся уникати великої кількості тексту в одному файлі PDF, дробіть один файл на декілька файлів, причому, лінки їх посиланнями всередині кожного такого документа (так, як би ви це робили зі звичайними HTML-документами).

Оптимізуйте текст файлу PDF під конкретні ключові запити, а тут треба приділяти увагу таким же показниками, як і на звичайній веб-сторінці (щільність ключових слів не вище 5% і іншим). Якщо ви хочете отримати добре індексований і релевантний пошуковим запитам контент PDF-документа, ви повинні намагатися уникати нагромадження сторінок в ньому. При внутрішньої оптимізації тексту, а саме: заголовків і підзаголовків, ключових слів і фраз, необхідних для вашого документа, - будьте дуже обережні, щоб файл не виглядав заспамленності і не вилетів, в результаті, з індексу пошукових систем.

Якщо ваш файл PDF розбитий на кілька частин, то налаштуйте порядок відображення цих частин. Від порядку читання документа залежить те, яка інформація буде надана пошуковому роботу спочатку, а яка - потім. Пам'ятайте, що найбільшу пошукову значимість мають ключові слова, що знаходяться ближче до початку документа, тому якщо в документі зворотне, то вам варто перебудувати логічну послідовність частин вашого PDF документа, щоб виділити найбільш важливі частини і поліпшити їх пошукову видимість в Інтернеті.

Зробіть зміст (пошукову карту документа), кожен пункт цього змісту оформите посиланням (закладкою) всередині PDF документа, для кожного посилання пропишіть ключові слова в описі посилання. Цей прийом найбільш ефективний для документів, що складаються з декількох логічний частин і з великою кількістю сторінок - він забезпечує якісну внутрішню перелинковку документа, що дозволяє ефективно індексувати документ пошуковим роботам.

Якщо ви хочете створити довідник, керівництво або інший документ, що передбачає великий обсяг інформації в одному файлі, то я рекомендую створювати подібні документи в форматі DjV u. Сторінки документів (контент) в цьому форматі не індексуються пошуковими системами. Але якщо з якихось причин у вас не виходить зменшити розмір PDF-файлів і розбити їх на кілька окремих файлів, то можна скористатися дуже зручною функцією в програмі Adobe Reader - Optimize for Fast Web View, що дозволяє переглядати вже завантажив сторінки документа, не чекаючи його завершення завантаження. Це зручно для тих користувачів, хто буде переглядати ваш PDF-файл безпосередньо на вашому сайті в режимі онлайн.

ДОДАТКОВА ІНФОРМАЦІЯ (метапол)

Дуже важливо заповнити всю додаткову інформацію про вашому файлі PDF. Приділіть особливу увагу таким тегам як: Title (заголовок), Author (автор матеріалу), Subject (Тема), Keywords (ключові слова документа), Descriptions (опис PDF-документа) і Copyright (авторські права). Всі ці настройки можна знайти в програмі Adobe Acrobat в меню File> Document Properties. Метадані файлу PDF мають схоже походження з метатегами файлів HTML, так що приділяйте їм особливу увагу при оптимізації.

КОДУВАННЯ, ШРИФТИ І РОЗТАШУВАННЯ ФАЙЛА

Кілька слів потрібно сказати і про оптимізацію шрифтів. Не забувайте включати в сам файл всі необхідні (нестандартні) шрифти. Досить часто для декоративних цілей використовуються найрізноманітніші і рідкісні поліграфічні шрифти, які можуть погано сприйматися пошуковими системами, тому, по можливості, намагайтеся користуватися стандартними шрифтами (Arial, Helvetica, Sans-Serif, Times New Roman та іншими), які добре індексуються пошуковими системами . Їх плюс в тому, що вони присутні за замовчуванням в будь-якій операційній системі, тому з документа PDF їх можна спокійно виключити, зменшивши тим самим розмір файлу.

Шрифти, що не були додані в PDF-документ або відсутні в операційній системі, будуть відображатися тим шрифтом, який є (найближчою за значенням), що може призвести до небажаних наслідків, а саме до збільшення або зменшення числа сторінок, кількості символів в рядках , міжрядкового інтервалу та інших проблем метрики.

Досить болючий параметр для пошукових систем - кодування файлу. Якщо пошукова система не зможе визначити кодування вашого PDF файлу самостійно, то документ взагалі не буде проіндексований, тому завжди перевіряйте, включено її. Бажано використовувати найвідоміші і популярні кодування.

Ваш файл PDF, як і звичайна сторінка файлу, повинен бути максимально близький до кореня сайту. Посилайтеся на них ближче до головної сторінки, не намагайтеся засунути його глибоко в структуру сайту, щоб не знизити пошукову значимість вашого PDF документа.

Не давайте ваших документів в форматі PDF занадто складні імена. Спрощуйте їх. Кілька слів в назві самого файлу розділяйте символом "_". Наприклад: imya_documenta.pdf. Також для роздільник можна використовувати і символ "-", але я рекомендую використовувати перший варіант.

Після всіх виконаних операцій по оптимізації можете викладати файл на сайт. Пошукові системи знайдуть файл, проїндексируют його і почнуть виводити в результатах пошуку, і якщо матеріал цікавий, почнеться самораскрутка його серед відвідувачів - на файл почнуть посилатися, завантажувати і публікувати його в інших місцях (а сам файл буде з посиланнями на ваш сайт). Непогано, чи не так?

Наостанок, надам вам пару посилань, які можуть бути корисні в зв'язку з опублікованим матеріалом:

http://ru.wikipedia.org/wiki/PDF - загальна інформація про фото PDF
http://get.adobe.com/reader/ - остання версія Adobe Reader
http://www.adobe.com/products/acrobat/ - остання версія Adobe Acrobat
http://www.abbyy.ru/pdftransformer/ - остання версія Abbyy PDF Transformer
http://www.taurion.ru/acrobat - самовчитель роботи в програмі Adobe Acrobat

У цьому огляді я постарався відповісти на найбільш поширені питання щодо оптимізації файлу PDF, які задають люди, що займаються розкручуванням сайтів. Але якщо у вас з'явилися питання або щось залишилося незрозумілим, то, будь ласка, повідомляйте про це! Буду радий будь-яким відгукам від вас! Дякуємо!



Перейти на початок сторінки
Перейти на початок сторінки   Подобається цей блог Подобається цей блог?
Підпишіться на оновлення блогу (RSS)
.
Підпишіться на коментарі (RSS) .

Непогано, чи не так?