Avisos
Vaciar todo

Problemas con la indexación de mi página en google  

Página 1 / 2
 
Juan José
 Juan José
Usuario activo

Buenos días.

Vaya por delante que tengo unos conocimientos básicos sobre la materia. Me he hecho una página web inspecciondeeducacion.com pero no consigo que sea indexada en las búsquedas de google; después de haber hecho (o entender que lo he hecho) los ajustes en google console, me aparecía que se habilitaba para móviles o algo así. Buscando en foros he leído que podría ser necesario realizar alguna tarea den Cpanel.

 

¿Alguien me puede ayudar al respecto?.

 

Gracias . Un saludo.

 

Juanjo

Citar
Respondido : 02/04/2020 10:43 am
Pepe
 Pepe
Soporte CMS Webempresa Admin

Hola Juan jose.

Necesitamos un poco más de información.

Supongo que ya validaste el dominio en Search console y no tuviste problemas con la validación.

me aparecía que se habilitaba para móviles o algo así.

¿ Puedes adjuntar una captura del aviso que tienes en sarch console ?

 

Por lo que puedo ver, estas bloqueando el acceso a los Robots de google desde el archivo robot.txt:

https://inspecciondeeducacion.com/robots.txt

Si te das cuenta en el archivo robot.txt tienes el siguiente código:

User-agent: *
Disallow: /


Este código lo que hace es bloquear los robots de los buscador para que no se indexen las paginas.

Realiza los siguiente pasos:

.- Accede al administrador de Wordpress.

.- Accede ajustes -> Lectura y revisa que no tengas seleccionada la opción " Disuade a los motores de búsqueda de indexar este sitio "

Screenshot 2020 04 02 12.28.08

 

.- Accede a tu cuenta de cPanel -> Administrador de archivos

.- Accede a la carpeta donde tienes instalado el wordpress y edita el archivo robot.txt.

screenshot cp504.webempresa.eu 2083 2020.04.02 12 30 27

 

.- Elimina el código anterior:

User-agent: *
Disallow: /

.- en el lugar donde tenía el anterior añade lo siguiente:

# Bloqueo basico para todos los bots y crawlers
User-agent: *
Allow: /wp-content/uploads/*
Allow: /wp-content/*.js
Allow: /wp-content/*.css
Allow: /wp-includes/*.js
Allow: /wp-includes/*.css
Disallow: /cgi-bin
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /wp-includes/
Disallow: /*/attachment/
Disallow: /tag/*/page/
Disallow: /tag/*/feed/
Disallow: /page/
Disallow: /comments/
Disallow: /xmlrpc.php
Disallow: /?attachment_id*

# Bloqueo de las URL dinamicas
Disallow: /*?


#Bloqueo de busquedas
User-agent: *
Disallow: /?s=
Disallow: /search


# Bloqueo de trackbacks
User-agent: *
Disallow: /trackback
Disallow: /*trackback
Disallow: /*trackback*
Disallow: /*/trackback


# Bloqueo de feeds para crawlers
User-agent: *
Allow: /feed/$
Disallow: /feed/
Disallow: /comments/feed/
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$


# Ralentizamos algunos bots
User-agent: noxtrumbot
Crawl-delay: 20
User-agent: msnbot
Crawl-delay: 20
User-agent: Slurp
Crawl-delay: 20


# Bloqueo de bots y crawlers poco utiles
User-agent: MSIECrawler
Disallow: /
User-agent: WebCopier
Disallow: /
User-agent: HTTrack
Disallow: /
User-agent: Microsoft.URL.Control
Disallow: /
User-agent: libwww
Disallow: /
User-agent: Orthogaffe
Disallow: /
User-agent: UbiCrawler
Disallow: /
User-agent: DOC
Disallow: /
User-agent: Zao
Disallow: /
User-agent: sitecheck.internetseer.com
Disallow: /
User-agent: Zealbot
Disallow: /
User-agent: MSIECrawler
Disallow: /
User-agent: SiteSnagger
Disallow: /
User-agent: WebStripper
Disallow: /
User-agent: WebCopier
Disallow: /
User-agent: Fetch
Disallow: /
User-agent: Offline Explorer
Disallow: /
User-agent: Teleport
Disallow: /
User-agent: TeleportPro
Disallow: /
User-agent: WebZIP
Disallow: /
User-agent: linko
Disallow: /
User-agent: HTTrack
Disallow: /
User-agent: Microsoft.URL.Control
Disallow: /
User-agent: Xenu
Disallow: /
User-agent: larbin
Disallow: /
User-agent: libwww
Disallow: /
User-agent: ZyBORG
Disallow: /
User-agent: Download Ninja
Disallow: /
User-agent: wget
Disallow: /
User-agent: grub-client
Disallow: /
User-agent: k2spider
Disallow: /
User-agent: NPBot
Disallow: /
User-agent: WebReaper
Disallow: /


# Previene problemas de recursos bloqueados en Google Webmaster Tools
User-Agent: Googlebot
Allow: /*.css$
Allow: /*.js$


Una vez lo tengas accede a la consola de Google y en el bloque " Rastreo " selecciona " probador de robots.txt "

robotstxtwordpress

 

Comprueba si no obtienes ningún error a la hora de leer el archivo robot.txt y se soluciona el problema que tenias.

 

Un saludo

ResponderCitar
Respondido : 02/04/2020 11:44 am

wpdoctor-revisa-la-salud-de-tu-wordpress

Juan José
 Juan José
Usuario activo

@pepesoler

Gracias, lo voy a intentar a ver si soy capaz.

 

Un saludo y espero que todos estén bien de salud.

ResponderCitar
Respondido : 03/04/2020 10:34 am
Pepe
 Pepe
Soporte CMS Webempresa Admin

Hola Jose Luis.

Gracias, si de momento todo bien, somos privilegiados por poder seguir haciendo lo que nos gustas y mantener la rutina.

Espero que tanto tú como tu familia y tus seres queridos estéis bien, seguro que dentro de poco vuelve a salir el sol y se normaliza de nuevo todo.

 

Ok, Seguro que puedes ya veras como si........dejo el hilo abierto por si necesitas volver a retomarlo 😉 

 

Un saludo

ResponderCitar
Respondido : 03/04/2020 10:59 am

Cursos Gratuitos WordPress

Juan José
 Juan José
Usuario activo

@pepesoler

Buenos días Pepe. Me he puesto a ello, pero a la vista de que me avisa que haga una copia de seguridad etc, y  de que, me avisa, que se pueden perder archivos, me da "miedo" estropear lo que tengo al no saber meter esta cantidad de códigos que me indicas. Porque como te digo me ha costado "sangre, sudor y lágrimas" hacer la página después de haber pasado por AULA CM, que son excelentes, pero no pude practicar en su momento y me tocó un año después retomar todo.

 

Quisiera hacerte la siguiente pregunta: vosotros podríais hacer estas correcciones en mi página para optimizarla? qué precio tendría?.

 

Gracias.

ResponderCitar
Respondido : 04/04/2020 12:25 pm
Pepe
 Pepe
Soporte CMS Webempresa Admin

Hola Juan Jose.

Nosotros no podemos realizar ningún cambio, lo siento, no lo tenemos permitido.

 me avisa que haga una copia de seguridad etc, y  de que, me avisa, que se pueden perder archivos.

Donde ves ese Aviso ? no pierdes nada si sigues los pasos que te indique, no tienes que eliminar ningún archivo.

 

De todas formas dispones de copias de seguridad de los últimos 30 Días que puedes restaurar fácilmente desde tu cuenta de cPanel.

-> https://guias.webempresa.com/preguntas-frecuentes/gestionar-copias-de-seguridad-con-superbackup-en-cpanel/

 

Un saludo

ResponderCitar
Respondido : 04/04/2020 12:49 pm

Juan José
 Juan José
Usuario activo

@pepesoler

Pues he creido verlo.

Me dice ésto:

"Editar

Haga una copia de seguridad del archivo original antes de convertir los conjuntos de caracteres, dado que esta acción puede provocar resultados inesperados.

/public_html/robots.txt"

Si la codificación no es importante para usted, ya que solo trabajará con el idioma inglés u otros idiomas occidentales, puede deshabilitar este diálogo si hace clic aquí: 

Seleccione la codificación del caracter que se usará cuando se abra este archivo: (detección automática)ansi_x3.110-1983ansi_x3.4-1968armscii-8asciiasmo_449big5big5-etenbig5-hkscsbrfbs_4730bs_viewdatacp10007cp1125cp1250cp1251cp1252cp1253cp1254cp1255cp1256cp1257cp1258cp737cp770cp771cp772cp773cp774cp775cp936cp949csa_z243.4-1985-1csa_z243.4-1985-2csa_z243.4-1985-grcsn_369103cwidec-mcsdin_66003ds_2089ebcdic-at-deebcdic-at-de-aebcdic-ca-frebcdic-dk-noebcdic-dk-no-aebcdic-esebcdic-es-aebcdic-es-sebcdic-fi-seebcdic-fi-se-aebcdic-frebcdic-is-frissebcdic-itebcdic-ptebcdic-ukebcdic-usecma-cyrilliceses2euc-cneuc-jisx0213euc-jpeuc-jp-mseuc-kreuc-twgb18030gb2312gb_1988-80gbkgeorgian-academygeorgian-psgost_19768-74greek-ccittgreek7greek7-oldgsm03.38hp-greek8hp-roman8hp-roman9hp-thai8hp-turkish8hzhz-gb-2312ibm037ibm038ibm1004ibm1026ibm1047ibm1124ibm1129ibm1132ibm1133ibm1160ibm1161ibm1162ibm1163ibm1164ibm256ibm273ibm274ibm275ibm277ibm278ibm280ibm281ibm284ibm285ibm290ibm297ibm420ibm423ibm424ibm437ibm500ibm850ibm851ibm852ibm855ibm856ibm857ibm860ibm861ibm862ibm863ibm864ibm865ibm866ibm866navibm868ibm869ibm870ibm871ibm874ibm875ibm880ibm891ibm903ibm904ibm905ibm918ibm922iec_p27-1inisinis-8inis-cyrillicinvariantisiri-3342iso-8859-1iso-8859-10iso-8859-11iso-8859-13iso-8859-14iso-8859-15iso-8859-16iso-8859-2iso-8859-3iso-8859-4iso-8859-5iso-8859-6iso-8859-7iso-8859-8iso-8859-9iso-8859-9eiso-ir-197iso-ir-209iso-ir-90iso_10367-boxiso_10646iso_11548-1iso_2033-1983iso_5427iso_5427-extiso_5428iso_646.basiciso_646.irviso_6937iso_6937-2-25iso_6937-2-addiso_8859-1,gliso_8859-suppitjis_c6220-1969-jpjis_c6220-1969-rojis_c6229-1984-ajis_c6229-1984-bjis_c6229-1984-b-addjis_c6229-1984-handjis_c6229-1984-hand-addjis_c6229-1984-kanajis_x0201johabjus_i.b1.002jus_i.b1.003-macjus_i.b1.003-serbkoi-8koi8-rkoi8-rukoi8-tkoi8-uks_c_5601ks_c_5601-1987ksc5636latin-greeklatin-greek-1mac-centraleuropemac-cyrillicmac-ismac-samimac-ukmacintoshmikmsz_7795.3nats-danonats-dano-addnats-sefinats-sefi-addnc_nc00-10nextstepnf_z_62-010nf_z_62-010_1973ns_4551-1ns_4551-2ptpt154pt2rk1048samisami-ws2sen_850200_bsen_850200_cshift_jisshift_jisx0213t.101-g2t.61-7bitt.61-8bittcvn5712-1tis-620tsciiunicode-1-1-utf-7us-asciiutf-7utf-8utf-8-strictvideotex-supplvisciiwindows-1251windows-1252windows-31j

Ayuda de alternancia…"

 

Dicho lo cual: Pregunto:

En todo caso, tengo que suprimir: user-agent:* y disallow: /?

Y ahí hacer un copia y pega de todo lo que me has escrito a partir de "en el lugar donde tenía el anterior añade lo siguiente"?

 

perdona si hago alguna pregunta absurda. Gracias

ResponderCitar
Respondido : 04/04/2020 1:07 pm
Pepe
 Pepe
Soporte CMS Webempresa Admin

Hola Juan Jose.

Nada, no te preocupes estamos para ayudaros 😉 

Y ahí hacer un copia y pega de todo lo que me has escrito a partir de "en el lugar donde tenía el anterior añade lo siguiente"?

Exacto, eliminas lo que te indique y copias y pegas el codigo que te pase en la anterior respuesta.

 

Un saludo

ResponderCitar
Respondido : 04/04/2020 1:18 pm

optimiza-automaticamente-todas-las-imagenes-de-tu-wordpress

Juan José
 Juan José
Usuario activo

@pepesoler

Gracias.

 

 Copio incluyendo este tipo de  encabezamientos?: # Bloqueo de bots y crawlers poco utiles

 

Gracias

ResponderCitar
Respondido : 04/04/2020 7:17 pm
Pepe
 Pepe
Soporte CMS Webempresa Admin

Hola Juan José.

Tienes que copiarlo todo tal cual esta, solo copias y pegas sin eliminar nada.

 

Un saludo

ResponderCitar
Respondido : 04/04/2020 7:24 pm

Gestor de Contraseñas - VPN Conexión Segura - Gestor 2FA (Segundo Factor de Autenticación

Juan José
 Juan José
Usuario activo

@pepesoler

Muchisimas gracias. Voy a ello.

 

mañana trabajáis? Un saludo.

ResponderCitar
Respondido : 04/04/2020 7:54 pm
Pepe
 Pepe
Soporte CMS Webempresa Admin

Hola Juan jose.

Ok, dejamos el hilo abierto por si tienes que retomarlo.

mañana trabajáis?

Si, trabajamos los 365 días las 24 Horas.....

 

Un saludo

ResponderCitar
Respondido : 04/04/2020 8:22 pm

wpdoctor-revisa-la-salud-de-tu-wordpress

Juan José
 Juan José
Usuario activo

@pepesoler

Gracias Pepe. He copiado los archivos con éxito.

tengo este mensaje:

Probador de robots.txt

Edita tu archivo robots.txt y comprueba que no tenga errores. Más información
Última versión vista el 1/4/20 8:32 Proceso correcto (200) 89 bytes
 
 
1
User-agent: *
2
Disallow: /
3
 
4
Sitemap:  http://inspecciondeeducacion.com/sitemap_index.xml 
 
 
 
 
 
 
0 errores
 
0 advertencias
 

 

ResponderCitar
Respondido : 04/04/2020 9:27 pm
Juan José
 Juan José
Usuario activo

Y al inspeccionar la URL: sigue apareciendo el mismo mensaje:

Cobertura
Se ha indexado aunque un archivo robots.txt la ha bloqueado
Detección
Sitemaps
N/D
Página de referencia
No se ha detectado ninguna
Es posible que la URL se haya reconocido a través de otras fuentes actualmente incompatibles
Rastreo
Último rastreo
2 abr. 2020 9:01:03
Rastreador
Robot de Google para smartphones
¿Se permite el rastreo?
No: bloqueada por el archivo robots.txt
Obtención de página
Error: Bloqueada por robots.txt
¿Se permite la indexación?
Indexación
Declarada por el usuario como canónica
N/D
Seleccionada por Google como canónica

 
URL inspeccionada

 

ResponderCitar
Respondido : 04/04/2020 9:30 pm

Cursos Gratuitos WordPress

Juan José
 Juan José
Usuario activo

Parece que el problema persiste. Y comprobé tambien que no estaba señalada la casilla de disuadir a motores de busqueda.

Mira esta información:

Inspección de URLs
 
 

PRUEBA EN TIEMPO REAL

Última prueba: 4 abr. 2020, 22:31
 

La URL no está disponible para Google
No se puede indexar. Más información
 
 
VER PÁGINA PROBADA
¿Ha cambiado la página?
 
 
SOLICITAR INDEXACIÓN
Disponibilidad
Bloqueada por robots.txt
La URL solo se indexará si se cumplen ciertas condiciones
Detección
La información no se ha comprobado en las pruebas de la página publicada
Rastreo
Hora
4 abr. 2020 22:31:45
Rastreador
Robot de Google para smartphones
¿Se permite el rastreo?
No: bloqueada por el archivo robots.txt
Obtención de página
Error: Bloqueada por robots.txt
¿Se permite la indexación?
N/D
Indexación
Declarada por el usuario como canónica
N/D
Seleccionada por Google como canónica

 
Información disponible tras la indexación

 

 

ResponderCitar
Respondido : 04/04/2020 9:33 pm
Página 1 / 2