| Durante un tiempo, me he dado cuenta de la bajada de la ventas desde mi sitio Web y no comprendía el motivo. Hasta que me he dado cuenta del mal uso del archivo robots.txt. Y para que no te ocurra lo mismo – comparto esta información, aunque no es una información difícil de encontrar en Internet. Algunas veces con la sobrecarga informativa no sabes ni lo que tienes que buscar. Y si eres un webmaster con poca experiencia – es posible que te sirva. El archivo robots.txt es un archivo de texto que se agrega a la carpeta raíz del sitio y contiene una serie de instrucciones para los motores de búsqueda. Normalmente, un motor de búsqueda, antes de ir a un sitio Web, primero analiza el archivo robots.txt y lee las instrucciones que contiene éste. El archivo robots.txt se utiliza con el fin de esconder de los robot de búsqueda ciertas páginas individuales, enlaces o carpetas para que no sean indexadas y para que no se muestren en resultados de búsquedas que se realizan en Internet. |
| ¿Por qué es necesario hacerlo? Por ejemplo, un sitio Web de negocios vende productos digitales de descarga inmediata después de realizar la compra. Necesitamos decir a los robots de los motores de búsqueda que no indexen las páginas de descarga de productos. De lo contrario, este producto puede aparecer abiertamente en Internet. Igual que me ha ocurrido a mi…
Si un sitio Web utiliza scripts – también es aconsejable no permitir que la carpeta con los scripts sea indexada. Hay también muchas otras situaciones cuando hace falta ocultar ciertos archivos y carpetas para que no aparezcan libremente en resultados de búsquedas. La utilización del archivo robots.txt facilita a los motores de búsqueda la indexación del contenido temático del sitio, porque al robot del buscador se le indica directamente el itinerario, dónde tiene que buscar y evita la pérdida de tiempo para rastrear todos los archivos y carpetas que componen un sitio Web. El archivo robots.txt puede incluir una o más instrucciones. En la primera parte se escribe: User-Agent: (nombre del motor de búsqueda). Si la instrucción se aplica a todos los motores de búsqueda, podemos escribir User-agent: *. La segunda parte incluye la palabra Disallow, es decir, “prohibir”. Si deseas prohibir la indexación en todo el sitio Web, tienes que escribir Disallow: / Puedes especificar qué carpetas (Disallow: / nombre de la carpeta /) o archivos (Disallow: / nombre del archivo y su extensión ) no deben ser indexados. También en el archivo robots.txt, puedes añadir comentarios, la línea debe comenzar con un comentario de #. Ejemplos de los archivos robots.txt: # Permitir a indexar todas las páginas a todos los motores de búsqueda # Prohibir indexar todas las páginas a todos los motores de búsqueda: # Prohibir al robot de Google ver a la carpeta http://nombre-del-sitio.com/test/ Prohibir # ver robots
Hay también otro modo para proteger de indexación una página, utilizando la Meta-tag: Las instrucciones pueden ser las siguientes: INDEX – permiso para indexar; Espero que te sirva esta información. Agradecería tu comentario. Fuente del artículo: Información recopilada de internet Recursos Recomendados:
Más artículos sobre aspectos de Diseño Web:
|
Artículos Relacionados
Etiquetas: Diseño Web Comercial





Leave a Reply: