Hola a tod@s de nuevo. Revisando search console veo que tengo miles de url con 404. Casi todas tienen la estructura como se ven en la imagen.
Me gustaria saber si le esto erjudica al seo de mi web y si hay alguna forma de decirle a los bots de google que no indexen esas urls.
Actualmente este es mi robot txt
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /wp-includes/
Disallow: /wp-admin/
Disallow: /my-account/
Allow: /wp-content/uploads/*
Allow: /ads/preferences/
Allow: /gpt/
Allow: /pagead/show_ads.js
Allow: /pagead/js/adsbygoogle.js
Allow: /pagead/js/*/show_ads_impl.js
Allow: /static/glade.js
Allow: /static/glade/
Allow: /tag/js/
Disallow: /*add-to-cart=*
Disallow: /cart/
Disallow: /checkout/# Lista de bots que deberías permitir.
User-agent: Googlebot-Image
Allow: /wp-content/uploads/
User-agent: Adsbot-Google
Allow: /
User-agent: Googlebot-Mobile
Allow: /#Impedir el acceso a los diferentes feed que genere la página
Allow: /feed/$
Disallow: /feed
Allow: /comments/feed
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$# Impedir URLs terminadas en /trackback/ que sirven como Trackback URL.
Disallow: /*/*/*/trackback/$# Evita bloqueos de CSS y JS.
Allow: /*.js$
Allow: /*.css$#Bloquear todos los pdfs
Disallow: /*.pdf$# Lista de bots bloqueados
User-agent: MSIECrawler
Disallow: /
User-agent: WebCopier
Disallow: /
User-agent: HTTrack
Disallow: /
User-agent: Microsoft.URL.Control
Disallow: /
User-agent: libwww
Disallow: /
User-agent: Orthogaffe
Disallow: /
User-agent: UbiCrawler
Disallow: /
User-agent: DOC
Disallow: /
User-agent: Zao
Disallow: /
User-agent: sitecheck.internetseer.com
Disallow: /
User-agent: Zealbot
Disallow: /
User-agent: MSIECrawler
Disallow: /
User-agent: SiteSnagger
Disallow: /
User-agent: WebStripper
Disallow: /
User-agent: WebCopier
Disallow: /
User-agent: Fetch
Disallow: /
User-agent: Offline Explorer
Disallow: /
User-agent: Teleport
Disallow: /
User-agent: TeleportPro
Disallow: /
User-agent: WebZIP
Disallow: /
User-agent: linko
Disallow: /
User-agent: HTTrack
Disallow: /
User-agent: Microsoft.URL.Control
Disallow: /
User-agent: Xenu
Disallow: /
User-agent: larbin
Disallow: /
User-agent: libwww
Disallow: /
User-agent: ZyBORG
Disallow: /
User-agent: Download Ninja
Disallow: /
User-agent: wget
Disallow: /
User-agent: grub-client
Disallow: /
User-agent: k2spider
Disallow: /
User-agent: NPBot
Disallow: /
User-agent: WebReaper
Disallow: /
User-agent: SeekportBot
Disallow: /
User-agent: PetalBot
Disallow: /
User-agent: dotbot
Disallow: /#Desautorizar a páginas innecesarias
Disallow: /gracias-por-suscribirte
Gracias
Contenido solo visible a usuarios registrados
Hola Jose,
Puedes compartirnos una de esas url para verificar si son en si un error 404? quedamos atentos
Un saludo
Hola de nuevo , una url de ejemplo:
También me quiero comentar algo que no he dicho antes. Hace tiempo si usábamos etiquetas para los productos, pero decidimos quitarlas ya que no nos aportaban nada. Las borramos alegremente sin crear las correspondientes redirecciones, lo cual entiendo que es un error de novato y que quizás por eso google aun intenta cogerlas, no se.. Todas las url que dan este error 404 tienen el mismo prefijo https://alcarazhigiene.es/etiqueta/
También añado que usamos el plugin redirection por si se puede hacer algo desde ahí.
Un saludo.
Hola Jose,
Sería bueno en este caso crear una redirección 404 to homepage, puedes hacer esto con este plugin:
https://wordpress.org/plugins/404-to-homepage/
Igualmente, puedes reenviar el sitemap a google para que se ajusten nuevamente los enlaces permitidos.
Un saludo 🖐️
Hola Jose,
En este caso puedes crear una redirección para que la URL que contenga etiqueta se dirija al Home y no muestre estos errores 404, si utilizar el plugin redirection puedes redirigir la url de etiqueta por ejemplo
https://alcarazhigiene.es/etiqueta/?
Ten en cuenta que vas a necesitar decirle a Google elimine estas URL de la indexación. Contenido solo visible a usuarios registrados
Prueba con esto y nos comentas como va todo
Un Saludo
Hola de nuevo. La idea del plugin me parece buena, pero antes de instalar un plugin mas (que ya tengo unos cuantos 😏 ) me gustaría hacerlo con redirection como dice Karen.
La pregunta es si tengo que hacerlo con todas las urls una por una o hay una forma que con solo el prefijo las coja todas?
Lo digo porque he probado a poner esto desde redirection para redirigirlo a la pagina principal
https://alcarazhigiene.es/etiqueta/?
y no redirige a ningún sitio
Un saludo
Hola Jose.
Añade lo siguiente al principio del archivo htaccess:
RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule . / [L,R=301]
ErrorDocument 404 /index.php
Este código redireccionará todos los errores 404 a la página principal.
Un Saludo
@pepesoler Gracias pepe por tu trabajo. Me parece genial tu código. Pero me surge una ultima duda. No seria mejor decirle a google que no indexe esas url en lugar de redirigirlas a la home?
Me explico, esas url no existen desde hace meses y no quiero que aparezcan en los motores de busqueda ni nada, es decir, marcarlas como contenido eliminado(creo que es 410)
Lo podría hacer asi? Lo recomiendas o es mejor redirigir?
Gracias
Hola Jose.
En principio tendrás que mantener un tiempo la redirección hasta que google las elimine de los resultados.
.- Accede a Search Console
.- Selecciona Retirada de URLs
.- Añade las URLs que quieres retirar:
Pasado un tiempo, digamos un mes, eliminas la redirección.
Un saludo
@pepesolerHola Pepe he inyectado el codigo que me has pasado en .htaccess como me has indicado.
Las urls con 404 se redirigen a la home como bien has indicado, pero creo que afecta a toda la tienda porque cuando le das a cualquier articulo, redirige a la home también.
He borrado el código y la web funciona ahora bien. Por que puede ser?
Hola José,
En este caso puedes probar utilizar el siguiente código en lugar del anterior
DirectoryIndex index.html
ErrorDocument 404 https://tudominio.com/
Verifica si con este funciona de forma correcta
Un saludo
@karen Hola Karen, lo he probado y la pagina no funciona. Mejor me dejo de codigos y voy a por el plugin directamente jejeje
Hola Jose.
Puedes utilizar una función:
function redirect_404s() { if(is_404()) { wp_redirect(home_url(), '301'); } } add_action('wp_enqueue_scripts', 'redirect_404s');
El código lo puedes añadir al final del archivo functions.php que encontrará en wp-content -> themes -> tu_plantilla.
Si no quieres editar código puedes añadirlo con el plugin Code Snippets:
-> https://es.wordpress.org/plugins/code-snippets/
Tienes una guía sobre el plugin en este enlace:
Un saludo