13 ноября 2009 г.

Польза robots.txt

Всем известно, что файл robots.txt задуман как средство позволяющее управлять индексированием вашей страницы поисковыми машинами и запрещать индексировать информацию которая у пользователя поисковиков явно интереса не вызовет и приватную информацию, наверное как способ обезопаситься.

Сегодня наткнулся на одном ресурсе (фрагмент файла robots.txt):
# Directories
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /profiles/
Disallow: /scripts/
Disallow: /sites/
Disallow: /themes/
# Files
Disallow: /CHANGELOG.txt
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /install.php
Disallow: /INSTALL.txt
Disallow: /LICENSE.txt
Disallow: /MAINTAINERS.txt
Disallow: /update.php
Disallow: /UPGRADE.txt
Disallow: /xmlrpc.php
# Paths (clean URLs)
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /logout/
Disallow: /node/add/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/

Обезопасиванье на лицо :)

3 комментария: