# # robots.txt para www.flotadorderayas.com esta basado # en el robots.txt de la wikipedia http://www.wikipedia.org/ # # # No queremos crawlers que se dedican a descargar sitios enteros # User-agent: sitecheck.internetseer.com Disallow: / User-agent: Zealbot Disallow: / User-agent: MSIECrawler Disallow: / User-agent: SiteSnagger Disallow: / User-agent: WebStripper Disallow: / User-agent: WebCopier Disallow: / User-agent: Fetch Disallow: / User-agent: Teleport Disallow: / User-agent: TeleportPro Disallow: / User-agent: WebZIP Disallow: / User-agent: linko Disallow: / User-agent: HTTrack Disallow: / User-agent: Microsoft.URL.Control Disallow: / User-agent: Xenu Disallow: / User-agent: larbin Disallow: / User-agent: libwww Disallow: / User-agent: ZyBORG Disallow: / # # wget puede llegar a ser un problema en modo recursivo. # Se puede utilizar la opcion --wait para establecer un retardo entre peticiones # User-agent: wget Disallow: / User-agent: grub-client Disallow: / # # Este se dedica a descargarse webs de forma recursiva. # Lo ha debido programar el tipo que queria que le grabaran Internet en un disquete # User-agent: WebReaper Disallow: / # # Instrucciones para el resto de crawlers # User-agent: * Disallow: */feed* Disallow: */trackback Disallow: */wp-admin Disallow: */wp-includes Disallow: *wp-login.php Sitemap: http://www.flotadorderayas.com/sitemap.xml