Как написать правильный файл Robots.txt?

На примере одного из продвигаемых интернет-магазинов покажу, как работает файл robots.txt и какую ошибку нельзя допускать.

Какой он был, такой он и остался…

После запуска новой паблик-версии магазина я набралась терпения и стала ждать, когда же старые страницы начнут выпадать из индекса… Но через 2 недели с удивлением заменила, что этого не происходит :) Не стоит говорить, что “прошло слишком мало времени”, так как в моем случае это отмазка.
Итак…

Что обнаружила методом простого анализа robots.txt в Яндексе и Google:

Содержимое старого robots.txt не запрещало индексацию нужных URL’ов:

User-agent: Yandex
Disallow: /*_openstat
Disallow: /*from=adwords

Host: domain.ru
Sitemap: http://domain.ru/sitemap.xml

User-agent: Googlebot
Disallow: /*_openstat
Disallow: /*from=adwords

User-Agent: *
# catalogs
Disallow: /css/
Disallow: */css/
Disallow: /js/
Disallow: */js/
Disallow: /product/
Disallow: */product/
Disallow: /home/
Disallow: */home/
Disallow: /i/
Disallow: */i/
Disallow: /phpMyAdmin1/
Disallow: /sessions/
Disallow: /?
# files
Disallow: */.html
Disallow: */searchProduct.html
Disallow: */advancedSearch.html
Disallow: /simage.php

Проверка robots.txt в Яндексе - путь разрешен

Немного поэкспериментировав, поняла как исправить ошибки в robots.txt и в таком виде он заработал:

User-agent: Yandex
# catalogs
Disallow: /css/
Disallow: */css/
Disallow: /js/
Disallow: */js/
Disallow: /product/
Disallow: */product/
Disallow: /home/
Disallow: */home/
Disallow: /i/
Disallow: */i/
Disallow: /phpMyAdmin1/
Disallow: /sessions/
Disallow: /?
Disallow: /*_openstat
Disallow: /*from=adwords
# files
Disallow: */.html
Disallow: */searchProduct.html
Disallow: */advancedSearch.html
Disallow: /simage.php

Host: domain.ru
Sitemap: http://domain.ru/sitemap.xml

User-agent: Googlebot
# catalogs
Disallow: /css/
Disallow: */css/
Disallow: /js/
Disallow: */js/
Disallow: /product/
Disallow: */product/
Disallow: /home/
Disallow: */home/
Disallow: /i/
Disallow: */i/
Disallow: /phpMyAdmin1/
Disallow: /sessions/
Disallow: /?
Disallow: /*_openstat
Disallow: /*from=adwords
# files
Disallow: */.html
Disallow: */searchProduct.html
Disallow: */advancedSearch.html
Disallow: /simage.php

User-Agent: *
# catalogs
Disallow: /css/
Disallow: */css/
Disallow: /js/
Disallow: */js/
Disallow: /product/
Disallow: */product/
Disallow: /home/
Disallow: */home/
Disallow: /i/
Disallow: */i/
Disallow: /phpMyAdmin1/
Disallow: /sessions/
Disallow: /?
# files
Disallow: */.html
Disallow: */searchProduct.html
Disallow: */advancedSearch.html
Disallow: /simage.php

Проверка robots.txt в Яндексе - Url запрещен к индексации

Вывод:

Прописывайте Disallow: для каждого User-agent отдельно.

А так же…

Не забудьте подписаться на блог или следить за новыми твиттами! ;)

  • VKontakte
  • Facebook

One thought on “Как написать правильный файл Robots.txt?

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>