Волоконовский информационный портал
Информационно развлекательный портал поселка Волоконовка и Пятницкое Белгородской области
  

Регистрация или ВходГлавная Главная | п.Волоконовка Волоконовка | Форум Форум | Актуальные темы Темы | Заработай не выходя из дома Заработай $$$ | Компьютерные игры, чит коды, патчи к играм Игровые Новости | Наши Публикации Статьи | Карта сайта Карта
Главное меню:
Главная
Волоконовка
Общий Форум
Игровой Форум
Наши Новости
Архив новостей
Актуальные темы
Наши Публикации
Мобильн. новости
Гостевая книга
Доска Объявлений

Гороскоп
Анекдоты
Flash игры
Фото Галерея
Фото приколы

Курсы валют
TV программа
Прогноз погоды
Транспондеры
Интернет радио
Скачать Файлы

Аксесуары
Скачать МР3 песни
Скачать мини игры
Игры на WebMoney
Цифровые товары

Поиск
Опросы
Топ Сайтов
Каталог сайтов
Вопросы и ответы
Общие Правила
Наш счетчик:
Понедельник569
Вторник645
Среда727
Четверг672
Пятница635
Суббота559
Воскресенье529
Online:7
Всего:798980
Рекорд:3137
Регистраций:
Сегодня:5
Вчера:7
Всего:4658
Последний:FireFox
Рекомендуем:
Рекомендуем:

Новые файлы:
  Yukon Gigabit драйв...
  Новая версия лучшег...
  ProgDVB - для просм...
  Проигрыватель Light...
  Аська QiP Build 803...
Реклама:
Расскрутка и оптимизация сайта
Статьи по раскрутке, продвижению и оптимизации сайта.
Подробное описание robots.txt

Поисковые сервера всегда перед индексацией вашего ресурса ищут в корневом каталоге вашего домена файл с именем robots.txt. Этот файл сообщает роботам (паукам-индексаторам), какие файлы они могут индексировать, а какие нет.

ормат файла robots.txt - особый. Он состоит из записей. Каждая запись состоит из двух полей: строки с названием клиентского приложения (user-agent), и одной или нескольких строк, начинающихся с директивы Disallow: <Поле> ":" <значение>

Robots.txt должен создаваться в текстовом формате Unix. Большинство хороших текстовых редакторов уже умеют превращать символы перевода строки Windows в Unix. Либо ваш FTP-клиент должен уметь это делать. Для редактирования не пытайтесь пользоваться HTML-редактором, особенно таким, который не имеет текстового режима отображения кода.


Поле User-agent

Строка User-agent содержит название робота. Например:

User-agent: googlebot

Если вы обращаетесь ко всем роботам, вы можете использовать символ подстановки "*":

User-agent: *

Названия роботов вы можете найти в логах вашего веб-сервера. Для этого выберите только запросы к файлу robots.txt. большинство поисковых серверов присваивают короткие имена своим паукам-индексаторам.


Поле Disallow:

Вторая часть записи состоит из строк Disallow. Эти строки - директивы для данного робота. Они сообщают роботу какие файлы и/или каталоги роботу неразрешено индексировать. Например следующая директива запрещает паукам индексировать файл email.htm:

Disallow: email.htm

Директива может содержать и название каталога:

Disallow: /cgi-bin/

Эта директива запрещает паукам-индексаторам лезть в каталог "cgi-bin".

Если директива Disallow будет пустой, это значит, что робот может индексировать ВСЕ файлы. Как минимум одна директива Disallow должна присутствовать для каждого поля User-agent, чтобы robots.txt считался верным. Полностью пустой robots.txt означает то же самое, как если бы его не было вообще.


Пробелы и комментарии

Любая строка в robots.txt, начинающаяся с #, считается комментарием. Стандарт разрешает использовать комментарии в конце строк с директивами, но это считается плохим стилем:

Disallow: bob #comment

Некоторые пауки не смогут правильно разобрать данную строку и вместо этого поймут ее как запрет на индексацию ресурсов bob#comment. Мораль такова, что комментарии должны быть на отдельной строке.

Пробел в начале строки разрешается, но не рекомендуется.

  Disallow: bob #comment


Примеры

Следующая директива разрешает всем роботам индексировать все ресурсы сайта, так как используется символ подстановки "*".

User-agent: *
Disallow:

Эта директива запрещает всем роботам это делать:

User-agent: *
Disallow: /

Данная директива запрещает всем роботам заходить в каталоги "cgi-bin" и "images":

User-agent: *
Disallow: /cgi-bin/
Disallow: /images/

Данная директива запрещает роботу Roverdog индексировать все файлы сервера:

User-agent: Roverdog
Disallow: /

Данная директива запрещает роботу googlebot индексировать файл cheese.htm:

User-agent: googlebot
Disallow: cheese.htm

Если вас интересуют более сложные примеры, попутайтесь вытянуть файл robots.txt с какого-нибудь крупного сайта, например CNN или Looksmart.


Распространенные ошибки

Одна из самых распространенных ошибок - перевернутый синтаксис:

User-agent: *
Disallow: scooter

А должно быть так:

User-agent: scooter
Disallow: *

Часто при составлении файла robots.txt в одной строке указываются несколько директив Disallow:

Disallow: /css/ /cgi-bin/ /images/

Различные пауки поймут эту директиву по разному. Некоторые проигнорируют пробелы и поймут директиву как запрет на индексацию каталога /css//cgi-bin//images/. Либо они возьмут только один каталог (/images/ или /css/) и проигнорируют все остальное.

Правильный синтаксис таков:

Disallow: /css/
Disallow: /cgi-bin/
Disallow: /images/

Иногда в файле robots.txt перечисляют все файлы каталога, как например:

Disallow: /AL/Alabama.html
Disallow: /AL/AR.html
Disallow: /Az/AZ.html
Disallow: /Az/bali.html
Disallow: /Az/bed-breakfast.html

Вышеприведенный пример можно заменить на:

Disallow: /AL
Disallow: /Az

Помните, что начальная наклонная черта обозначает, что речь идет о каталоге. Конечно, ничто не запрещает вам перечислить парочку файлов, но мы речь ведем о стиле. Данный пример взят из файла robots.txt, размер которого превышал 400 килобайт, в нем было упомянуто 4000 файлов! Интересно, сколько роботов-пауков, посмотрев на этот файл, решили больше не приходить на этот сайт.


Особенности Google

Google - первый поисковый сервер, который поддерживает в директивах регулярные выражения. Что позволяет запрещать индексацию файлов по их расширениям.

User-agent: googlebot
Disallow: *.cgi

В поле user-agent вам следует использовать имя "googlebot". Не рискуйте давать подобную директиву другим роботам-паукам.


Дата публикации: 01.05.2006 | Прочитано: 984 раз


Дополнительно на данную тему:
Полезная информация для тех кто раскручивает свой сайт
Полезная информация для тех кто раскручивает свой сайт
Стратегии позиционирования сайта в поисковых системах
Стратегии позиционирования сайта в поисковых системах
Что же такое Google Dance?
Что же такое Google Dance?
Общая информация о поисковых системах
Общая информация о поисковых системах
Внутренние факторы ранжирования
Внутренние факторы ранжирования
Внешние факторы ранжирования
Внешние факторы ранжирования
Индексация сайта
Индексация сайта
Yandex и Google - секреты поиска
Yandex и Google - секреты поиска
Последние новости с форума
Книга почтой:

Ваша информация:


Добро пожаловать
Гость

Регистрация
Потеряли пароль?

Логин:
Пароль:
Код:Код
Повтор:

Сейчас онлайн:
Пользователей: 0
Гостей: 1
БотовБотов: 6
Всего: 7

Поисковые боты:
Google
shop
Yahoo
Forums
Yahoo
shop
YaDirect
Files
Опросы:
С какой целью Вы посещаете портал?

Чтение новостей
Чтение форума
Поиск файлов
Обзоры железа
Инфа о городе
Фотогалерея
Обзоры игр
Прогноз погоды
TV программа
Sat TV интернет
Все вместе
Другое



Результаты
Другие опросы

Всего голосов: 158
Комментарии: 7
Рекомендуем:



Новый анекдот:
В чеpном чеpном гоpоде, на чеpной чеpной улице, в чеpном чеpном доме, в чеpной чеpной кваpтиpе, сидят два чеpных чеpных мужика, и один дpугому говоpит:
- Hикогда больше не буду сам запpавлять каpтpиджи!
Рейтинг:
 Послать другу
Случайная фраза:
В историю трудно войти, но легко вляпаться.
История:
Прогноз погоды:


см прогноз на неделю
Курсы валют:
USD США23,3759
EUR Евро37,1069
GBP Фунт46,5508

Все валюты на

04.07.2008
Главная Главная | Поиск по сайту Поиск | Различные файлы Файлы | Архив новостей Архив | Актуальные темы Темы | Фото Галерея Галерея | Каталог сайтов Ссылки | Гостевая книга Гостевая | Рекомендовать нас Рекомендовать | Обратная связь Контакты
News RSS
Рейтинг@Mail.ru
Интернет магазин CD и DVD дисков ! Аксессуары для сотовых телефонов, дата кабели, зарядные устройства, аккумуляторные батареи, флэш карты, сим адаптеры, CD с драйверами для сотовыхRambler's Top100


Powered by SLAED CMS, released under the GNU/GPL license.
Генерация страницы: 0.788 сек. и 34 запросов к базе данных за 0.049 сек.