статьи веб дизайн разработка сайтов [advansed search]  [карта сайта]

разработка


графика


продвижение и PR


будни разработки


обзоры




автор: Андрей Зяблицев

НЕСКОЛЬКО СЛОВ О ФАЙЛЕ 'ROBOTS.TXT'
И МЕТА-ТЭГЕ 'ROBOTS'.

16. 06. 2001

Здесь я даю лишь обзорную информацию, а подробности и информацию о последних изменениях вы можете найти сайтах авторов (см. ниже).

robots.txt

Назначение файла robots.txt:

Этот файл предназначен для указания исключений для поисковых систем. Т.е. Вы можете указать файлы и/или каталоги, которые индексировать не надо. Например, это могут быть результаты работы CGI-скиптов, сводка о погоде, и пр.
Как ни странно, если такого файла на вашем сервере нет, то поисковые роботы вобще ничего не индексируют!
Файл robots.txt должен находиться в корневом каталоге веб сервера. Обычно это public_html, html, www.
Формат:
Имеется два ключевых слова, User-Agent и Disallow.
User-Agent — определяет имена роботов и Disallow — файлы и каталоги.
В простейшем случае robots.txt может быть таким:

User-Agent: *

Disallow:

Другой пример:

# агенту василий_пупкин запрещено индексировать все.

User-Agent: vasya_pupkin

Disallow: / 

# агентам  google rex yandex rambler запрещено
# индексировать все что лежит в каталогах
# /cgi-bin/ и /privat/ а также все файлы и
# каталоги, которые начинаются с '/not_for_robots',
# и еще /anekdoty/pro/robotov.htm

User-Agent: google rex yandex rambler 

Disallow: /not_for_robots /cgi-bin/  /privat/

Disallow: /anekdoty/pro/robotov.htm 


User-Agent: *
               # всем остальным агентам
Disallow:      # нет ограничений.
meta—robots

Иногда мы не имеем возможности создать файл 'robots.txt', в таких случаях можно использовать тэг ROBOTS в заголовке html-файла.
Вот несколько примеров:


<meta name="robots" content="all">
<meta name="robots" content="none">
<meta name="robots" content="index,follow">
<meta name="robots" content="noindex,follow">
<meta name="robots" content="index,nofollow">
<meta name="robots" content="noindex,nofollow">

А означают они вот что:
index — разрешает индексировать данный документ.
follow — разешает следовать символическим ссылкам.
all — разрешает индексировать данный документ и следовать ссылкам.
соответственно noindex, nofollow, none — запрещают. ·Имя тэга "ROBOTS" и значения нечуствительны к регистру.
·Недопустимо использование конфликтующих значений, например:

<meta name="robots" content="noindex,nofollow,all,follow,noidex,all">




Источники:

Charles P.Kollar, John R.R. Leavitt, Michael Mauldin, Robot Exclusion Standard Revisited www.kollar.com/robots.html
Martijn Koster, Standard for robot exclusion info.webcrawler.com/mak/projects/robots/robots.html



Статьи по теме "оптимизация и продвижение веб-сайта в Интернет:"

 

 

наверх наверх

MoiKrug - Вукс ТатьянаВукс Татьяна


NunDesign © 2001-2008 All rights reserved