Buenas tardes,
Tengo una duda que no sé si me podréis ayudar. Tengo un archivo robot_https con el siguiente contenido:
User-agent: Googlebot
Disallow: /
User-agent: *
Disallow: /
Que si entiendo bien significa que no se rastree el directorio https
El problema es que mi Blog opera sobre ese https y no sé si tengo que hacer algo para que se indexe bien.
https://www.alqueso.es/es/blog
Bueno ya me decís
Muchas gracias
Un saludo
URL del sitio: Contenido solo visible a usuarios registrados
Hola,
El nombre del archivo no creo que realiza acción alguna, lo que no tengo claro es si quieres que se indexe o no. Puedes revisar el siguiente enlace: https://moz.com/community/q/how-do-you-disallow-https
Hola, me he leido el artículo pero no es mi caso concreto. Yo quiero que se indexe la parte del blog. El blog tiene las url https y eso no creo que lo pueda cambiar. Mi pregunta es si la existencia de ese robots_https puede estar impidiendo o perjudicando la indexación del blog. Sin embargo no quiero que se indexe el resto de contenido https ya que generaría contenido duplicado. Y lo que no sé es qué hacer. O si tengo que hacer algo.
Muchas gracias
Un saludo
Hola,
Por defecto, el archivo robots_https que tienes (supongo que es un txt) no estaría actuando, a menos que tengas alguna redirección configurada en tu archivo .htaccess como la siguiente:
RewriteEngine On RewriteCond %{HTTPS} =on RewriteRule ^robots.txt$ robots-deny-all.txt [L]
En todo caso, y si tal como comentas quieres permitir que los buscadores rastreen los artículos de tu blog, lo mejor será que renombres o borres el archivo robots_https, o que por lo menos lo edites y lo dejes vacío.