Buenos días,
Hace aproximadamente 2 meses consulté en este foro acerca de unos avisos en Search Console, pero todavía me siguen apareciendo estos avisos, aunque han variado un poco.
Según me comentásteis, el motivo era que había habido anteriormente en la web artículos sin item de menú, o que no tenían asignada una categoría.
Efectivamente, esa situación ocurrió, ya que había artículos asignados a un componente.
No obstante, leyendo en las páginas de Google que se enlazan desde Search Console, dicen que si no tomo ninguna acción al respecto no pasa nada, a no ser que mi sitio haya sido penalizado por práctica fraudulenta, cosa que no es así.
Los avisos son los siguientes:
- Páginas con metadescripciones duplicadas: 102
- Etiquetas de título duplicadas: 88
- Paginas con metadescripciones cortas: 13
Siguiendo vuestras recomendaciones, instalé un plugin canonical y también un plugin Osmap, como mapa del sitio, el cual está añadido a Search Console. Actualmente también estoy poniendo en las páginas indicadas etiquetas de título más diferenciadas y metadescripciones más largas y variadas.
Voy a comentaros un poco más el problema:
Páginas con metadescripciones duplicadas: 102
Pertenecientes a páginas de “golfsitges”
Las URLS con metadescripciones duplicadas llevan al mismo artículo en questión, que no es que tenga la metadescripción repetida en otro artículo, sino que, simplemente, es el mismo artículo.
Viendo con detenimiento estas URLS que me indica Search Console , algunas están formadas por antiguas categorías + un artículo, categorías actuales + un artículo, el componente “buscar” + un artículo, e incluso algunas URLS están formadas por 2 artículos y una categoría.
Etiquetas de título duplicadas: 88
Pertenecientes a páginas de “golfsitges”
Exactamente la misma situación que con las “metadescripciones duplicadas”.
Paginas con metadescripciones cortas: 13
Pertenecientes a páginas de un Pretashop que está intalado dentro de la carpeta “golfsitges” y que está en proceso de construcción.
Páginas con recursos bloqueados: 30
En este caso me ha bajado bastante el número de recursos bloqueados y además me indica que la última detección fue hace más de 3 meses.
Dudas:
He leido varios post acerca de este tema, pero no me aclaro mucho. Alguno dice que no hay penalización de Google si no es “contenido duplicado malintencionado”. He leido también que estos avisos pueden tardar mucho en desaparecer, aunque el problema esté (a lo mejor) solucionado.
¿Está bien colocar las metadescripciones solo en el artículo? (No en el item de menú o en la categoría).
¿Tengo que borrar estas URL'S no canónicas de los resutados de búsqueda mediante la Search Console?
¿Es conveniente colocar alguna etiqueta en las páginas de productos de Prestashop para que no sean indexados?
¿Sería mejor que el Prestashop estuviera en un domino propio y en una carpeta fuera de golfsitges?
¿Puede tener que ver algo de todo esto con al archivo robots.txt?
¿Puede haber otras soluciones?
Disculpar si me he extendido demasiado en mi consulta.
Muchas gracias,
Jaime
URL del sitio: Contenido solo visible a usuarios registrados
Hola,
Lo primero que tendrías que comprobar es el tema de las páginas con metadescripciones duplicadas. Por lo que comentas esto te ocurre porque realmente se está cargando la misma página con distinta url. Si has añadido un plugin para cargar la url canónica tendrías que comprobar si estas páginas duplicadas tienen la misma url canónica. Es decir, si aunque la misma página cargue con distintas url la url canónica es la misma en todos las urls.
Para esto precisamente se usan las urls canónicas: se le indica a los buscadores que aunque una página cargue con distintas urls la que vale es la url canónica, que sí debería ser siempre la misma.
Sobre donde colocar las metadescripciones, es indiferente si las colocas en el artículo o en el elemento de menú que lo carga, siempre y cuando verifiques que la metadescripción está cargando.
No debería de haber problema con que PrestaShop se encuentre en el mismo dominio, si así lo prefieres. La única diferencia sería que de esta forma el análisis de Webmaster Tools sería global, es decir, se analiza de forma conjunta Joomla y PrestaShop como si se trataran de una única web.
El archivo robots.txt sirve principalmente para indicarle a los buscadores las páginas o directorios que no tiene que revisar. No debería influir en nada en los temas que comentas.
Hola Pablo,
Muchas gracias por atención.
Creo que te refieres a que si al final de cada URL existe el trozo correspondiente a la URL canónica (o correcta) del artículo en questión ¿no?
Si te refieres a eso, de las 102 metadescripciones duplicadas, la mayor parte de la URLS terminan con la canónica, por ejemplo:
/44-nuevos-swings/otros-videos-de-golf-de-interes/143-el-swing-de-golf-de-phil-mickelson
/los-origenes-del-golf/44-nuevos-swings/otros-videos-de-golf-de-interes/143-el-swing-de-golf-de-phil-mickelson
/que-es-la-ryder-cup/44-otros-videos-de-golf-de-interes/143-el-swing-de-golf-de-phil-mickelson
/vocabulario/44-nuevos-swings/otros-videos-de-golf-de-interes/143-el-swing-de-golf-de-phil-mickelson
Estas últimas URLS van a parar todas a un artículo que existe.
En otros casos Google Search Console me da como metadescripciones duplicadas una serie de URLS variadas que ni siquiera terminan con la URL de ningún articulo, pero que llevan a una página donde se ven varios artículos como si de un blog se tratara.
Y no lo tengo configurado para que aparezca así en ningún menú de la web.
También una me lleva a la página de contacto, otra me lleva al mapa del sitio, y en otros casos (de otra metadescripción duplicada segun Search Console) la URL me lleva a la página de “registro de usuario” cuando no lo tengo habilitado en el front.
/beth-allen-usa
/clinics-de-golf
/component/content/?id=20
/component/content/featured?id=featured
/contactos
/el-origen-del-bunker-de-golf/42-jugadoras-let/117-lee-anne-pace-sudafrica
/guia-reglas/42-jugadoras-let/124-laura-davies-inglaterra
/ique-es-el-handicap/42-jugadoras-let
/ique-es-el-pitch-a-putt/44-otros-videos-de-golf-de-interes
/los-origenes-de-los-palos-de-golf/42-jugadoras-let
/los-origenes-de-los-palos-de-golf/44-otros-videos-de-golf-de-interes
/los-primeros-disenos-modernos-de-campos-de-golf/44-otros-videos-de-golf-de-interes
En este caso, por ejemplo, me indica como metadescripción duplicada la metadescripción general del sitio:
Cursos y clases de golf en la zona de Vilanova i Geltrú y Sitges, Barcelona. Cursos y clases de gol
Hay otros casos, en artículos más antiguos donde no había puesto metadescripción, en que Joomla me toma como metadescripción el primer trozo del artículo, pero que Google Search me da también como metadescripciones duplicadas. Por ejemplo:
/acerca-del-golf/35-las-primera-reglas-del-golf-clases-de-golf-handicap-
/las-primeras-reglas-del-golf
También tengo metadescripciones duplicadas de artículos que ya he eliminado.
En otros artículos antiguos puestos en Joomla, he ampliado la metadescripción y la he variado en cuanto a léxico y también me da como metadescripción duplicada:
/44-otros-videos-de-golf-de-interes/135-el-swing-de-golf-de-severiano-ballesteros
/severiano-ballesteros
No sé si puede ser significativo este dato, pero lo comento:
En Google Search Console, en el apartado “Estado de Indexación” me marca el día
10/01/16 un total de 213 páginas indexadas.
Sin embargo en el apartado “Sitemap” me marca:
Enviadas: 63
Indexadas 61
¿Qué podría hacer para solucionar esto? Creo que no es muy grave, pero quisiera evitar futuros problemas.
Muchas gracias de nuevo,
Jaime
Hola,
La url canónica es otra cosa, cuando estés cargando una página de tu web vete a ver el código fuente y comprueba si aquí tienes un código como el siguiente dentro del head:
De ser así, prueba a abrir 2 páginas donde te indique metadescripciones duplicadas. Si realmente ves que se está cargando la misma página con distinta url vete a ver el código fuente de las 2 páginas y verifica si tienen la misma url canónica.
Buenas tardes Pablo.
Efectivamente encuentro el código que me indicas en todas la páginas que he mirado mediante el código fuente:
link href="url de la página" rel="canonical" />
Desde Search Console voy abriendo páginas que me pone como metadescripción duplicada y me llevan al mismo artículo, pero con una URL diferente, pero dentro de una etiqueta canonical. Es la misma URL que en Search Console.
Sin embargo, en otros casos, hay algunas URLS que me llevan al mismo artículo, pero mirando en el código fuente, la URL incluida en la etiqueta canonical es completamente diferente, por ejemplo:
Esto corresponde en Search Console a:
/acerca-del-golf/36-las-distancias-de-los-palos-cursos-de-golf-iniciacion
/las-distancias
En otros casos en el código fuente la URL canonica también cambia, en este caso me lleva a páginas con varios artículos tipo blog, que como te comenté, no tengo configurado.
/16-historia-del-golf
/16-historia-del-golf?start=8
/17-de-interes
/17-de-interes?start=8
/43-jugadores-european-tour/126-henrik-stenson-suecia
¿Qué te parece?
Muchas gracias,
Jaume
Hola
En este caso que comentas , son artículos diferentes a loa que se hace referencia en la url de canonical, entiendo que esto aparece en links del mismo artículo con diferente url
La url no existe :
Contenido solo visible a usuarios registrados
Tods tus artículos son accesibles desde alguna url del menú?
De manera general para evitar todos estos problemas de url con parámetros que son las mismas que tus urls amigables, crea una estructura de categorías y artículos y luego en tu menú has referencia a través de ítems de menú a las categorías preferentemente, la idea es que todos tus artículos se puedan consultar desde los ítems de menú.
Luego las metadescripciones las puedes poner en el artículo individual y también a nivel de categoría y de ítem de menú.
Saludos.
Hola John,
Todos los artículos son accesibles desde el menú, actualmente.
¿Cómo puedo solucionar este problema de avisos de Search Console?
No entiendo lo que me comentas que haga referencia a las categorías.
Tampoco entiendo lo que me comentas de las URLS amigables.
¿Por favor, puedes ampliarme un poco la información que me das?
Gracias,
Jaime
Hola,
Google solo indexa los enlaces que encuentra. De esta forma, si tienes un mismos artículo detectado que carga con 2 urls distintas es porque Google ha encontrado estos 2 enlaces. Entiendo que teóricamente solo te interesa tener uno de ellos, y del otro no se sabe su procedencia.
Lo que te tendrías que tratar de buscar es el referrer (páginas desde donde se enlaza) de las urls que no deberían estar, para verificar si en estas páginas de procedencia lo tienes todo bien.
En todo caso, ten en cuenta que esto de las metadescripciones duplicadas no debería afectarte demasiado en el posicionamiento. Ten en cuenta que en Joomla es muy difícil no tener estos duplicados, debido a la forma que tiene de generar las urls.
Hola Pablo,
Perdóname, no entiendo qué es el "referer". ¿Podrías ponerme un ejemplo?
Te agradezco tu paciencia,
Un saludo
Jaime
Hola,
El referer es la página desde donde se enlaza a otra página. En tu caso, tienes casos de páginas que cargan con 2 urls diferentes, cuando realmente se trata de la misma página. Si google ha guardado estas 2 urls es porque ha encontrado enlaces que llevan a esas direcciones en concreto.
Por tanto, lo que habría que averiguar en qué página se encuentra el enlace a la url que no debería existir.
No se si ahora ha quedado claro, sino me dices.
Hola Pablo,
Yo tengo entendido que los robots araña rastrean los servidores y de ahí toman las URLS que luego indexan y muestran en los resultados de busquedas. Pensaba que el problema es que los robots rastrean e indexan del servidor URLS que no son las canónicas, que luego aparecen el los resultados de búsqueda.
No entiendo dónde pueden estar estas páginas "refer" que me comentas.
Si una URL que está mal me lleva a un artículo, ¿Cual es el refer? ¿la página del artículo?
Si una URL que está mal me lleva a una página de registro, cuando no lo tengo habilitado, ¿Cual es el refer?
¿la página de registro?
Si una URL que está mal (o no es la canónica), está compuesta por una categoría que no existe + un artículo que no existe ¿cual es el refer?
Muchas gracias de nuevo por tu tiempo, Pablo.
Un saludo,
Jaime
Un saludo
Jaime
Hola
Con respecto a tus consultas
El refer que te comenta pablo, sería la url desde donde se enlaza a este artículo, esta url puede estar en tu propio sitio, en otro artículo, o puede ser que en algún momento del desarrollo de tu sitio google lo haya indexado, antes de que habilites urls amigables por ejemplo o de que elimines o cambies este artículo, también es posible que se enlace desde un sitio externo.
Es posible que se haya dado alguno de estos casos en las urls que te reporta google.
Para corregir esto , un primer alcance que le puedes dar a google es enviarle un mapa de tu sitio, asegurate que las referencias a tus artículos sean únicas o que tengan urls con canonical en caso de estar repetidas. Luego tendrías que esperar unos días a ver si aún siguen apareciendo errores .
Saludos.
Hola John,
Ya puse un plugin canónical y un mapa del sitio hace muchos meses.
Voy a esperar unas semanas aver si bajan los avisos.
Muchas gracias tanto a ti como a Pablo. Hacéis un trabajo muy complicado.
Un cordial saludo,
Jaume