Авг 09

продвижение  сайта с помощью PDF файлов


А индексирует ли Google полностью PDF файлы? Ответ на этот вопрос прост, конечно Да, Google научился индексировать PDF файлы начиная с 2001 года. Тем не менее, есть очень важный вопрос, могут ли поисковые боты полностью проиндексировать PDF документы, так же как и обычную html страницу.



В настоящее время для Google ботов полная индексация PDF файлов совершенно не является проблемой и соответственно
публикация контента в формате PDF, не препятствует поисковой оптимизации. Представляю для вас некоторые факты, которые
помогут вам понять, в какой мере Google индексирует PDF контент.



1. Может ли Google проиндексировать все типы PDF файлов.

К счастью, Google может проиндексировать большинство PDF файлов, но есть и некоторые исключения, это PDF файлы с установленной защитой от копирования. Такой тип документов является недоступным для поисковых систем. Другими словами, google индексирует все PDF файлы, которые вы можете просмотреть и скопировать их содержимое.



2. Индексация изображений в PDF файлах.

Google не может проиндексировать изображения непосредственно из PDF файлов, пока они не будет размещены на web странице. Однако даже на обычной web странице google не сможет проиндексировать изображение, до тех пор, пока у него не будет ALT тега. Отсутствие ALT тэга, делает изображения недоступными для индексации. Атрибут alt выдает текст вместо изображения в том случае, если у пользователя отключен показ изображений в браузере. Не стоит так же забывать об атрибуте title (не путать с тегом title страницы), который позволяет пользователю прочитать название картинки при наведении на него курсора. Эти оба атрибута используются поисковой системой для определения тематики картинки и участия ее в поисковой выдаче.



3. Индексация ссылок в PDF файлах.

Все ссылки в PDF файлах индексируются так же, как и стандартные html ссылки. Единственным исключением является то, что ссылки в PDF документах не могут быть "NOFOLLOW". Так что ссылки с PDF документов несут такую же пользу для PageRank как и ссылки с web страниц. По ссылке с PDF файла поисковая система может проследовать так же, как по обычной ссылке с web страницы, так что делайте выводы.



4. Можно ли запретить или удалить PDF из SERP.

Вы можете не только запретить индексацию PDF документов, но и удалить уже проиндексированные документы из выдачи. Решением обеих задач является использование X-Robots-Tag: noindex в заголовке HTTP, которое запретит индексацию PDF файлов от поисковой системы. Даже если PDF файл уже был проиндексирован, то при использовании вышеописанной команды, PDF документ пропадёт из индекса в течение короткого времени.



5. Считается ли одинаковый контент в PDF и на web странице дублированным.

Google всегда предполагает, что только одна версия web документа является уникальной. Если же несколько страниц имеют одинаковое содержание, то в этом случае можно использовать тег ‘rel=canonical’ внутри тега на страницах с дублированным контентом. Таким образом, Google поймет, что все дубликаты ссылаются на канонический адрес, указанный в теге.
Пример использования тега

То же самое применимо к дублированию контента между HTML и PDF. Каноническая версия документа может быть указана в HTML коде web страницы или в HTTP заголовке страницы, содержащей PDF файл. Предпочтительный вариант для индексации, может быть так же сделан при помощи включения URL канонической страницы в карту сайта.



6. Сможет ли быть PDF документ быть в топе поисковой выдачи?

Уникальный и хорошо оптимизированный PDF документ имеет такие же шансы на высокий рейтинг в поисковой системе, как и хорошо оптимизированная web страница. Оптимизация PDF документа ничем не отличается от оптимизации обычной web страницы.


written by Andrey Еlshin \\ tags: ,


Сайт работает на wordpress | © 2008-2017 elshin.ru Политика конфиденциальности
Использование материалов сайта разрешается только с размещением гиперссылки.
Все вопросы, пожелания, предложения направлять на e-mail: andrey@elshin.ru