Hola! Tengo un problema, y es cada vez más. Siempre tenía páginas, que Google no ha indexado, pero ahora se ha vuelto mucho peor. Casi tengo más páginas que no se indexan comprar las páginas que si. Adjunto el informe. No entiendo cual es el problema, ¿Qué puedo hacer?
Muchas gracias y saludos,
Corinna
Contenido solo visible a usuarios registrados
Hola de nuevo, tengo más páginas para añadirlo para este problema. Igual serían de ayuda. Muchas gracias!
Hola Corinna.
De normal suelen ser páginas con redirecciones, Canónicas o paginaciones pero necesitamos ver las URL de las páginas que no se indexan para poder ver exactamente a qué se refiere.
.- Selecciona Páginas y mostrar un informe con el motivo y si seleccionas el motivo verás la URL que no se están indexando:
Por lo que veo en tu última captura son páginas canónicas y no index pero necesitamos ver las URL para poder informarte mejor.
Un saludo
@pepesoler
Buenos días! Ahora casi tengo las páginas indexadas con el numero de páginas cuando empecé con la web. Entiendo que hay varios links que no estan intexadas, pero tantos? Significa que para google no he puesto prácticamente nada nuevo desde entonces? Y las que no están indexados son importantes, lo más importante, por lo que me visitan la web, sobre todo categoria de juegos. Es muy frustrante trabajar y luego ni lo indexan. Es como no trabajar, no añadir nada nuevo.....
Si entro en estos links, funcionan bien, y llevan a un sitio, que es el correcto.
Te pongo algunos ejemplos:
https://alemangratis.net/category/vocabulario-flash/page/2/
https://alemangratis.net/category/juegos/vocabulario/vocabulario-con-imagenes/page/3/
https://alemangratis.net/category/vocabulario-2/vocabulario-tarjetas/page/2/
https://alemangratis.net/category/niveles/nivel-1-niveles/page/16/
https://alemangratis.net/category/juegos/page/14/
https://alemangratis.net/category/ubungen/page/3/
https://alemangratis.net/category/niveles/page/61/
https://alemangratis.net/category/juegos/page/18/
https://alemangratis.net/category/juegos/page/18/
Espero que me puedes ayudar, porque como ya he dicho es muy frustrante, hacer todo este trabajo, que luego queda en nada.
Muchas gracias y saludos,
Corinna
@pepesoler
Buenos días! Ahora casi tengo las páginas indexadas con el numero de páginas cuando empecé con la web. Entiendo que hay varios links que no estan intexadas, pero tantos? Significa que para google no he puesto prácticamente nada nuevo desde entonces? Y las que no están indexados son importantes, lo más importante, por lo que me visitan la web, sobre todo categoria de juegos. Es muy frustrante trabajar y luego ni lo indexan. Es como no trabajar, no añadir nada nuevo.....
Si entro en estos links, funcionan bien, y llevan a un sitio, que es el correcto.
Te pongo algunos ejemplos:
https://alemangratis.net/category/vocabulario-flash/page/2/
https://alemangratis.net/category/juegos/vocabulario/vocabulario-con-imagenes/page/3/
https://alemangratis.net/category/vocabulario-2/vocabulario-tarjetas/page/2/
https://alemangratis.net/category/niveles/nivel-1-niveles/page/16/
https://alemangratis.net/category/juegos/page/14/
https://alemangratis.net/category/ubungen/page/3/
https://alemangratis.net/category/niveles/page/61/
https://alemangratis.net/category/juegos/page/18/
https://alemangratis.net/category/juegos/page/18/
Espero que me puedes ayudar, porque como ya he dicho es muy frustrante, hacer todo este trabajo, que luego queda en nada.
Muchas gracias y saludos,
Corinna
Hola Corina.
Las con terminación /page/ son paginaciones. Google generalmente trata de no indexar URLs con terminaciones cómo /page/2/ (o /page/3/, /page/4/, etc.), ya que suelen corresponder a páginas de paginación. Google las considera contenido duplicado o de poco valor individual, ya que estas páginas suelen ser versiones de contenido ya accesible en la página principal o en las páginas de categoría. Este tipo de URLs son vistas como menos relevantes para el usuario y, por lo tanto, pueden no aparecer en el índice de Google.
En resumen, no indexar las páginas de paginación es una práctica recomendada, ya que ayuda a que Google se enfoque en las URLs con contenido único y de valor.
Luego veo que tienes otras con terminación /fed/
Los feeds (o fuentes de datos) son archivos generados automáticamente por la mayoría de los sitios web para distribuir contenido. Estos archivos, comúnmente en formato RSS o Atom, contienen un resumen o lista de las publicaciones o actualizaciones recientes del sitio, y están diseñados para ser leídos por aplicaciones o servicios, como lectores de RSS. Los feeds ayudan a que los usuarios y otras plataformas puedan suscribirse y recibir actualizaciones sin tener que visitar el sitio web directamente.
Google no indexa generalmente los feeds por varias razones:
Contenido Duplicado: Los feeds suelen replicar el contenido que ya existe en las páginas originales del sitio. Si Google indexara los feeds, vería el mismo contenido en múltiples URLs, lo cual no aporta valor adicional y se considera duplicado.
Experiencia de Usuario: Los feeds están diseñados para el consumo automatizado y no para la navegación de los usuarios. Por lo general, no tienen un diseño atractivo o funciones de navegación que mejorarían la experiencia del usuario.
Evitar Confusión en el Índice de Google: Indexar los feeds podría hacer que Google asocie contenido valioso con una URL de feed en lugar de la página original, lo cual podría afectar la visibilidad de la página original en los resultados de búsqueda.
En resumen, los feeds son una forma útil de distribuir contenido a otras aplicaciones o usuarios suscritos, pero no son adecuados ni necesarios para indexarse en los motores de búsqueda.
Luego veo otros que por etiqueta canónica
La etiqueta canónica (rel="canonical") es un atributo de HTML que indica a los motores de búsqueda cuál es la URL "preferida" o "original" cuando el mismo contenido o contenido similar está disponible en varias URLs. Esta etiqueta ayuda a evitar problemas de contenido duplicado al decirle a Google y otros motores de búsqueda cuál versión de la página debe ser priorizada y considerada como la "oficial" o "canónica".
Imagina que tienes una página de producto que se puede acceder mediante varias URLs (por ejemplo, debido a parámetros en la URL que filtran o rastrean clics). Sin la etiqueta canónica, Google podría considerar que todas estas URLs diferentes representan contenido duplicado, lo que puede afectar negativamente el SEO. Al usar una etiqueta canónica en esas URLs alternativas, se especifica la URL principal que debe indexarse.
Si una página incluye una etiqueta canónica apuntando a otra URL, Google suele decidir no indexarla, ya que:
Google Prefiere Indexar la URL Principal: Cuando una página se etiqueta como canónica de otra, Google prioriza la URL canónica como la versión más relevante. Esto permite que la URL principal reciba el tráfico y la autoridad de las otras versiones.
Para Evitar Contenido Duplicado: Las etiquetas canónicas ayudan a consolidar contenido duplicado o muy similar en una única URL, lo que reduce la confusión para el motor de búsqueda y mejora el SEO del sitio.
Optimización del Rastreo y el Índice: Google solo quiere indexar el contenido más relevante, y al excluir páginas no canónicas, evita desperdiciar recursos en URLs que, en realidad, son versiones duplicadas o menos importantes.
La etiqueta canónica le dice a Google qué URL es la preferida para indexar cuando hay varias versiones del mismo contenido. Google excluye de la indexación las URLs con etiquetas canónicas que apuntan a otra URL, siguiendo la indicación de priorizar y centralizar el contenido en una sola URL canónica. Esto ayuda a evitar problemas de contenido duplicado y optimiza la visibilidad de la página en los resultados de búsqueda.
El único aviso que tienes que revisar son los 404, tienes que ver esas URL si cargan y si cargan validar la corrección.
Para evitar los errores 404 puedes instalar un plugin que redirecciones todos los 404 por ejemplo a la página de inicio:
-> https://wordpress.org/plugins/404-to-homepage/
Solo tienes que activar el plugin, no tiene ninguna configuración.
Para evitar que google rastree los Feed y las paginaciones puedes añadir lo siguiente en el archivo robots.txt:
#Impedir el acceso a los diferentes feed que genere la página
Allow: /feed/$
Disallow: /feed
Disallow: /comments/feed
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Para la paginación:
Disallow: /page/
En definitiva,no tienes que preocuparte si Google te muestra mensajes indicando que las URLs de paginación (page/2/, page/3/, etc.) y de feeds no están indexadas. De hecho, es normal y deseable que estas URLs no se indexen, ya que generalmente no aportan valor individual al SEO de tu sitio y pueden considerarse contenido duplicado o de baja calidad. Google excluye estas páginas intencionalmente, y ver estas notificaciones en Search Console es normal y no afecta negativamente el SEO de tu sitio.
Un Saludo