Hola a tod@s!
En mi web tengo 222 páginas reales e indexadas, pero Google Search Console me muestra que tengo 822 no indexadas. Esas páginas no las he creado yo y son variaciones que se han generado de forma automática de mis categorías y entradas.
Para que se vea más claro y lo entendáis, os voy a poner varios ejemplos:
La estructura normal de mi sitio web para una categoría sería: .../destinos/europa/alemania/frankfurt
Y las que muestra Search Console son: .../category/destinos/alemania/frankfurt
Me elimina la categoría de "europa" y me añade "category".
Y para las entradas, me copia una entrada original de mi blog y al final me añade diferentes elementos como:.
.../que-ver-en-frankfurt/?filter_by=popular7
.../que-ver-en-frankfurt/?filter_by=random_posts
.../que-ver-en-frankfurt/feed
Search Console me las muestra como enlaces rotos (404) o como páginas con redirección. Pero no están indexadas, únicamente aparecen en mi Search Console.
En principio no hay ningún malware en la web y esta generación automática (según he leído casos parecidos, pero ninguno igual) puede deberse a algún plugin o una mala configuración.
¿A alguien le ha pasado algo parecido o sabe de qué puede ser?
Gracias!
Contenido solo visible a usuarios registrados
Hola Ismael
?filter_by=popular7
Esta terminación es de el filtro de búsqueda, es normal que las muestre y supongo que las tendras como Canónicas, para desactivar los Feed y las busquedas puedes añadir lo siguiente en el archivo robots.txt:
#Impedir el acceso a los diferentes feed que genere la página Allow: /feed/$ Disallow: /feed Disallow: /comments/feed Disallow: /*/feed/$ Disallow: /*/feed/rss/$ Disallow: /*/trackback/$ Disallow: /*/*/feed/$ Disallow: /*/*/feed/rss/$ Disallow: /*/*/trackback/$ Disallow: /*/*/*/feed/$ Disallow: /*/*/*/feed/rss/$
#Bloquear parámetros Disallow: / *?
Las demás de las categorías me temo que es lo mismo serán Canónicas pero necesitamos ver lo que te indica Google para confirmarlo mejor.
Un saludo