Buenos dias equipo,
Me ha llegado un mail de Search Console, indicando que tengo 149 páginas no indexadas.
La mayoría son de mi blog, pero también están las páginas de mi pagina web importantes.
Hay URL´s que no tengo, desconozco, y no sé como han salido.
En las URL´s del blog, la mayoría son las que tienen buffer, Twitter o Hootsuite, pero hace mil años que no utilizo estas herramientas.
Os pongo varias, pero me preocupa que hayan tantas URL´s raras con mi página de inicio con la "p" y unos números. ¿Sabesi decirme a qué se debe?
https://www.lovevisualmarketing.com/?p=63887
https://www.lovevisualmarketing.com/tacticas-esenciales-contenido-visual/?replytocom=641
https://www.lovevisualmarketing.com/?p=63902
https://www.lovevisualmarketing.com/pagina-de-quienes-somos
https://www.lovevisualmarketing.com/pagina-de-quienes-somos/
https://www.lovevisualmarketing.com/?p=5739
https://www.lovevisualmarketing.com/el-mejor-color-para-tu-web/?replytocom=623
https://www.lovevisualmarketing.com/s
https://www.lovevisualmarketing.com/la-tipografia-en-el-
https://www.lovevisualmarketing.com/a
https://www.lovevisualmarketing.com/blog/
https://www.lovevisualmarketing.com/branding/
https://www.lovevisualmarketing.com/herramientas/
https://www.lovevisualmarketing.com/el-mejor-color-para-tu-web/?replytocom=626
https://www.lovevisualmarketing.com/contact/
https://www.lovevisualmarketing.com/contacto
https://www.lovevisualmarketing.com/?p=5481
https://www.lovevisualmarketing.com/?p=63564
Contenido solo visible a usuarios registrados
Hola Susana.
La terminación ?utm_source=buffe es un conjunto de parámetros UTM (Urchin Tracking Module), que se utiliza para rastrear el origen del tráfico hacia un sitio web en Google Analytics o en otras herramientas de análisis web. Estos parámetros permiten identificar de dónde provienen los usuarios que acceden a tu página a través de enlaces específicos.
Aquí te explico cada uno de los parámetros:
utm_source=buffer: Indica la fuente del tráfico. En este caso, "buffer" es la plataforma desde donde se compartió el enlace (Buffer es una herramienta de gestión de redes sociales).
utm_campaign=Buffer: Es el nombre de la campaña de marketing asociada con este enlace. Aquí la campaña tiene el nombre "Buffer".
utm_content=buffer26d19: Este parámetro se usa para diferenciar contenido o enlaces dentro de la misma campaña. Por ejemplo, si el mismo enlace está presente en diferentes lugares, utm_content puede identificar cuál de ellos generó el clic. El valor "buffer26d19" es un identificador único asignado.
utm_medium=twitter: Indica el medio por el cual se distribuyó el enlace, en este caso "twitter", lo que sugiere que el enlace fue compartido en esa red social.
Cuando usas una herramienta como Buffer para compartir contenido en redes sociales, puedes agregar estos parámetros a los enlaces para que, una vez que el usuario hace clic en ellos, Google Analytics recoja la información y te muestre los datos sobre de dónde proviene el tráfico, qué medio o red social se utilizó, y qué campaña estaba activa.
La terminación ?p=63887 es un parámetro que se usa comúnmente en WordPress para identificar una publicación o página específica a través de su ID.
Este tipo de URL es típico en sitios de WordPress que no tienen los enlaces permanentes configurados en una estructura amigable para SEO (por ejemplo, algo como https://tusitio.com/nombre-de-la-publicacion), y en su lugar usan la estructura de enlaces predeterminada de WordPress, que se basa en el ID de la publicación.
Es posible que en su momento tuvieras activados los enlaces simples:
El parámetro ?replytocom= es comúnmente utilizado en WordPress para gestionar respuestas a comentarios en publicaciones o páginas.
Este parámetro indica una respuesta a un comentario específico en una publicación o página de WordPress. El número xxx es el ID del comentario al que se está respondiendo.
Este tipo de URL aparece cuando un visitante hace clic en el enlace de "responder" a un comentario en un sitio de WordPress. La página recargará la misma publicación o página con la respuesta enfocada a ese comentario en particular.
Este ultimo parametro puedes bloquearlo a los rastreadores añadiendo lo siguiente al archivo robots.txt:
User-agent: *
Disallow: /*?replytocom
En este caso no veo problemas para el SEO pero siempre es mejor bloquear parámetros innecesarios añadiendo lo siguiente en el archivo robots.txt
User-agent: *
Disallow: /*?replytocom
Disallow: /*?utm_source
Disallow: /*?utm_medium
Disallow: /*?sessionid
Un saludo
@pepesoler Hola Pepe,
Muchísimas gracias por tu respuesta tan detallada y profesional.
Lo que me llama la atención es que (hace muchos años) utilicé Buffer para compartir mis artículos pero hace muuuuchos años que dejé de usarla. Y me ha llegado este aviso de GSC esta semana. ¿Puede ser que todavía hubieran rastros en internet?
Podrías por favor indicarme ¿dónde ingreso ese código? En qué parte de mi web, que está en Wordpress con Elementor.
Sobre estas URL´s que están en el listado y que no añaden el código de Buffer, ni Twitter, ¿debo preocuparme por qué dice GSC que no indexan? ¡Es mi web!
https://www.lovevisualmarketing.com/s
https://www.lovevisualmarketing.com/a
https://www.lovevisualmarketing.com/blog/
https://www.lovevisualmarketing.com/branding/
https://www.lovevisualmarketing.com/herramientas/
https://www.lovevisualmarketing.com/contact/
https://www.lovevisualmarketing.com/contacto
Gracias Pepe.
Hola Susana.
hace muuuuchos años que dejé de usarla
Buffer se puede configurar con plugins ( Veo que no tienes ninguno instalado ) o mediante una API que se configura desde la plataforma de Buffer y que probablemente sea la forma en la que lo configuraste, de todas formas no te preocupes, si ya añadiste lo que te indique en el archivo Robots.txt Google ya no lo rastreara y ese aviso con el tiempo desaparecerá.
Sobre estas URL´s que están en el listado y que no añaden el código de Buffer, ni Twitter, ¿debo preocuparme por qué dice GSC que no indexan?
Esas páginas tendríamos que ver cual es el motivo por la que no las indexa
.- Accede a Search Console:
.- Selecciona paginas y veras que hay una sección " ¿Por qué hay páginas que no se indexan? "
.- Selecciona uno de los motivos y revisa las URL que te indica, tienes que encontrar las URLs que indicas en alguno de esos motivos, puede ser porque sea una URL Canónica, Redirección o que Google eligió otra URL canónica:
De todas formas veo que /herramientas/ redirecciona a otra pagina y no tendrías que preocuparte por eso ya que Google lo único que busca es que cargue contenido
Lo mismo pasa con /s y /a redirigen a otra URL y lo más seguro Google las esté marcando como canónicas.
Una URL canónica es una etiqueta HTML (<link rel="canonical">) utilizada para indicar a los motores de búsqueda cuál es la versión preferida de una página web, en caso de que haya múltiples versiones o URLs con contenido similar. La URL canónica ayuda a evitar problemas de contenido duplicado y asegura que los motores de búsqueda entiendan qué página es la principal y debe ser indexada y mostrada en los resultados de búsqueda.
Google puede elegir automáticamente una URL canónica si existen páginas con contenido duplicado o considera que la que tú has indicado no es la más adecuada. Aunque siempre es recomendable que tú indiques la URL canónica preferida, Google utiliza sus propios algoritmos para decidir cuál debe ser la canónica en función de factores como la calidad del contenido, la estructura del sitio y la coherencia de las URLs.
En principio no tendrías que hacer nada, solo por curiosidad revisa lo que te indique en Search console para ver el motivo por el cual no se están indexando.
Por cierto, en tu archivo robots.txt no tienes añadido el Sitemap y eso si que es importante:
.- Edita el archivo robots.txt y al final añade lo siguiente:
Contenido solo visible a usuarios registrados
Una vez lo tengas vuelve a mandar el Sitemap:
Solo tienes que añadir la terminación sitemap_index.xml, el dominio ya lo añade google de la propiedad que tienes configurada.
En definitiva, no creo que tengas que realizar ninguna acción pero como te comente revisa en Search console el motivo por el cual no se indexan.
Un Saludo
@pepesoler Eres un crack Pepe y lo explicas todo muy sencillo aunque sea algo técnico.
No he añadido todavía los parámetros que me indicaste en el archivo robots txt porque no sé donde se hace.
Te preguntaba en mi anterior respuesta esto "Podrías por favor indicarme ¿dónde ingreso ese código? En qué parte de mi web, que está en Wordpress con Elementor."
Si me ayudas a hacerlo, lo hago enseguida. Gracias!
Sobre lo que sale en GSC de ¿Por qué hay páginas que no se indexan? esto es lo que he encontrado,
He entrado en cada una, y hay de todo, no sé si necesitas que haga una captura y te las envíe o te adjunto las URL´s que salen dentro de cada uno de los motivos.
Muchas gracias.
En Search Console yo tengo 4 URL´s registradas.
Recuerdo que en su momento el desarrollador me indicó que subiera todas: con y sin www y con y sin la s de https. Por eso las 4 URL´s
La que elegimos como la de mi web es https:lovevisualmarketing.com (sin las 3 www)
Pero en todas hay datos, en unas mas y en otras menos.
He mirado en cada una y me sale que sí tengo un sitemap, te paso captura de pantalla.
Lo raro es que en algunas "alguien" ha intentado enviar como sitemap la URL de un artículo de mi blog, y dice ESTADO: 1 error. Y no sé quién ha sido porque yo no he sido.
Esto me puede estar perjudicando el SEO?
Hola Susana,
Puedes ver nuestra guía par enviar de nuevo tu sitemap a Google:
https://www.webempresa.com/blog/sitemap-en-wordpress.html
La sección que buscas es la de > Enviar el sitemap WordPress a Google Search Console, esto lo haces para que tome de nuevo las URL correctas de tu sitio por descartar si algunas de estas que nos comentas son importantes.
Para agregar lo que te indica Pepe, veo que trabajas con yoast seo, para ello ingresas en el panel lateral de Yoast seo > Herramientas > editor de archivo, aquí agregas lo que te envió Pepe.
Un saludo 🖐️
Hola Susana.
Los tres primeros Sitemap no son correctos y tendrás que eliminarlos, el único correcto es el ultimo.
.- Accede a Search Console -> Sitemaps
.- Selecciona uno de los sitemaps con error:
.- Una vez accedas al index de ese sitemap verás en la parte superior derecha un botón con tres puntos, si lo seleccionas podrás eliminar ese Sitemap:
Realiza el mismo paso para los otros Sitemaps que tienes con error.
Sobre lo que muestras de las páginas no indexadas si te das cuenta la mayoría es por etiqueta canónica que no tienes que preocuparte, si lo seleccionas podrás ver las URL, lo más seguro es por lo que comentas de las www, al tener las dos versiones una de ellas se asigna como canónica para evitar el contenido duplicado.
El aviso de redirección tampoco es importante ya que solo es una pagina que redirecciona a otra y mientras cargue contenido lo demás no importa.
Lo de las páginas 404 es porque no se encuentran, es posible que se eliminaran o cambiaran a otra URL, esto si que tienes que solucionarlo y una manera fácil es con un plugin que redireccione todos los 404 a la página de inicio:
-> https://wordpress.org/plugins/404-to-homepage/
Solo tienes que instalarlo y activarlo.
Una vez tengas todo esto:
.- Selecciona uno de los avisos y veras que tienes un Botón " Validar corrección "
.- Pulsa en el botón de Validar y espera a que google lo valide, suele pasar un tiempo y te contestan al correo:
Un saludo
@pepesoler Hola Pepe, muchas gracias.
De acuerdo, estos sitemaps no son correctos y debería eliminarlos, lo que me preocupa es ¿cómo han aparecido en GSC si yo no los he subido? ¿Me puede volver a pasar?
Ya eliminé los sitempas y solo queda el que dice "correcto" Entonces ya no tengo que subir el sitemap que me enviaste, Sitemap: https://lovevisualmarketing.com/sitemap_index.xml ¿verdad?
¿Tengo que hace el paso que me indica @Argenis "Yoast seo > Herramientas > editor de archivo, aquí agregas lo que te envió Pepe."? ¿O ya no es necesario?
Hola Susana.
¿cómo han aparecido en GSC si yo no los he subido? ¿Me puede volver a pasar?
Pues no te sabría decir nosotros no tenemos logs para poder identificarlo ya que es externo. No se si en algún momento le distes acceso a alguien para el SEO o algo parecido y los añadiera, sin acceso no se pueden mandar.
Sobre si puede volver a pasar, mientras no des acceso a alguien o compartas los accesos no tiene por qué volver a pasar.
Entonces ya no tengo que subir el sitemap que me enviaste
En tu caso lo volvería mandar , no siempre es necesario volver a enviar el sitemap a Google, pero si has realizado cambios significativos, corregido errores, o detectado problemas de indexación, reenviarlo puede ayudar a que Google rastree e indexe las páginas de tu sitio de manera más eficiente. Además, el envío regular de sitemaps puede mantener la indexación actualizada, especialmente si tu contenido cambia con frecuencia.
¿Tengo que hace el paso que me indica @Argenis "
Si, lo del Robots.txt tienes que añadirlo y acuérdate de añadir la URL del Sitemap
Un Saludo