Hola buenos días,
Estoy intentando editar el archivo robots.txt y dado que es algo delicado, os quería preguntar por ello y saber si lo estoy haciendo bien y si tenéis alguna recomendación.
He utilizado un archivo robots.txt de ejemplo de una web que utiliza el mismo tema que estoy utilizando en wordpress y con una estructura parecida a la mía, pero no se qué es /cs-gen/ por ejemplo y porqué le deshabilita el rastreo. Tampoco sé si es recomendable deshabilitar ?nonamp , ?utm_source o ?platform. Tampoco sé porque deshabilita /ads.txt
Este es el sitemap que estoy editando:
User-agent: * Allow: /wp-admin/admin-ajax.php Disallow: */?nonamp=* Disallow: */?utm_source* Disallow: */?platform=* Disallow: */feed/* Disallow: */cs-gen/
Disallow: /ads.txt Disallow: */?replytocom=* Disallow: */?p=* Disallow: /wp-admin/ sitemap: https://thedataschools.com/sitemap_index.xml
¿Me podríais dar alguna recomendación o decirme si hay algo que no debería editar?
Muchas gracias de antemano.
Un saludo
Contenido solo visible a usuarios registrados
Hola Manuel,
En este caso debes tener en cuenta que aunque los sitios web tengan una misma estructura o tema cada uno de ellos es distinto, ya que los objetivos que puede tener esta web pueden ser diferentes a los que tu deseas, por ejemplo de estas reglas se bloquea el utm_source el cual se utiliza permitir que herramientas como Google Analytics sepan la fuente del tráfico de alguna campaña.
Una recomendación general que puede seguir para tu archivo robots.txt puedes verla en el siguiente artículo que tenemos disponible → https://www.webempresa.com/blog/robots-txt-en-wordpress-que-problema-tienes-googlebot.html dentro del puedes ver el punto que menciona Cómo optimizar el Robots.txt para WordPress al máximo el cual puede ayudarte a crear tu archivo robots.txt
Un Saludo