blog webempresa

¿Cómo bloquear ChatGPT que rastreen el contenido de una web?

por | Abr 26, 2023 | Aprender WordPress

¿Cómo bloquear ChatGTP que rastreen el contenido de una web?

Hoy en día, es difícil proteger la privacidad de las páginas web, incluyendo la presencia de ChatGPT. Es por esto que es importante bloquear ChatGPT, para evitar que rastree el contenido de nuestra web, ya que su uso está en constante aumento y es importante cuando nuestro sitio se dedica a publicar contenido en internet.

El ChatGPT, como modelo de lenguaje de inteligencia artificial, puede recopilar y analizar información de las páginas web, lo que puede ser preocupante si se utiliza para obtener datos personales o de las páginas. Aunque es una herramienta útil para generar contenido es importante tener en cuenta su capacidad de recolectar información.

Es por esto que, en esta guía aprenderemos qué pasos seguir para bloquear el rastreo de esta IA sobre el contenido de nuestra página web, con un sencillo paso a paso y explicación general de lo que estamos haciendo para proteger nuestra web de esta herramienta nueva en internet.

¿Qué es ChatGPT?

 

Antes de comenzar es bueno conocer que es ChatGPT. Este es una inteligencia artificial que utiliza un sistema escrito de comunicación para generar respuestas a nuestras preguntas o comentarios, algo similar a lo que sería una conversación con una persona.

El lenguaje que tiene esta IA ha sido generado por el entrenamiento con textos recopilados de internet y por lo tanto, puede darnos respuestas con base en la información que tiene sobre estos temas.

El ChatGPT puede ser útil en situaciones donde necesitamos respuestas rápidas a preguntas generales, pero puede generar preocupación sobre la privacidad y seguridad de la información personal, que toma de una página web.

Es por esto que buscamos bloquear ChatGPT al momento de crear web WordPress, de esta forma nos aseguramos un poco más contra las IA, sin olvidar que hay otros métodos manuales donde no es tan sencillo protegernos como lo haremos en este caso.

El problema actual con ChatGPT

 

Si bien el ChatGPT es una herramienta útil, tiene algunos problemas que es bueno que tengamos en cuenta. En lo que respecta a auditoria seo WordPress, uno de los problemas es que los resultados generados por esta IA no son reconocidos como una fuente de información. Lo que puede provocar una penalización por parte de Google en nuestra web.

Otro de los problemas que pueden llegar a presentarse es que los usuarios se acostumbren a este ChatGPT como fuente de información, lo que puede ser negativo para la toma de opiniones y los diferentes puntos de vista, al punto de disminuir el contraste de información.

Existe una preocupación constante de que el uso constante por la generación actual, contribuya a que el contenido creado en un futuro sea de baja calidad o repetitivo, lo que puede hacer que las fuentes de información y opiniones desaparezcan.

Es importante tener en cuenta que la información proporcionada por ChatGPT puede no ser siempre precisa, por lo que es recomendable contrastarla con otras fuentes de información para validar su veracidad y originar nuestro propio criterio sobre un tema.

De manera general, es importante conocer las limitaciones actuales de esta IA y utilizarlo como una herramienta complementaria, similar a lo que sería un Mockup de WordPress, de forma que se utiliza como guía tanto para obtener información como para uso general, de esta forma no depender de ella.

Imagen complementaria de chatgpt

¿Como evitar que ChatGPT rastree nuestro contenido?

 

El uso de la herramienta de ChatGPT como hemos visto, puede plantear ciertas preocupaciones sobre la privacidad y seguridad WordPress. Es por esto que debemos saber cómo protegernos de la recopilación de información no deseada de los datos de nuestro sitio.

En esta sección, vamos a explicar cómo evitar o bloquear ChatGPT de nuestra web para proteger la privacidad de nuestro sitio web, con información sencilla pero muy clara sobre qué debemos hacer para bloquear los datos que puede recolectar, para lograr mantenerlos seguros.

Bloquear contenido por robots.txt

 

La primera opción que tenemos es la de bloquear ChatGPT por medio del archivo robots.txt WordPress. Esta medida es la más sencilla de aplicar para bloquear el acceso a esta y otras IA a nuestro contenido. Ya sea para proteger información personal o información de usuarios, podemos seguir los pasos que veremos más adelante para realizar el bloqueo.

Antes de continuar debemos saber que es un archivo robots.txt, en caso de no saberlo este archivo es:

Robots.txt: es un archivo de texto que se utiliza en todos los sitios para indicar a los robots de motores de búsqueda, como Google, Yahoo o Bing, qué páginas pueden rastrear o qué áreas de la web pueden ver. Este archivo se encuentra en la raíz del sitio: Public_html > dominio.

Bloquear el acceso a robots no garantiza la protección total de una página web contra herramientas de rastreo. Es necesario tomar otras medidas para bloquear estas herramientas de forma efectiva.

Vista de archivo robots.txt

Una vez tenemos ya los conocimientos necesarios para editar el archivo robots.txt podemos ver como indicarle a este archivo que no permita rastreos del usuario ChatGPT, para ello debemos agregar a nuestro archivo una serie de códigos.

User-agent: ChatGPT-User
Disallow: /
User-agent: OpenAI
Disallow: /
User-agent: ChatGPT
Disallow: /

Si, por el contrario, se llega a dar el caso de que queramos que los bot o las IA en este caso ChatGPT se conecte a ciertas áreas de nuestra web, debemos agregar el código de la siguiente forma:

User-agent: ChatGPT-User
Disallow: 
Allow: /category/noticias/
Allow: /tag/spain/

Hay que tener en cuenta que los códigos tanto de bloquear ChatGPT como permitir su acceso deben estar debajo del código de agente (user-agent), de esta forma va a ser reconocido por el navegador y el sitio web.

Bloquear ChatGPT en robots.txt desde Yoast SEO

 

Si utilizamos el plugin Yoast SEO, podemos tener a la mano algunas opciones para poder modificar el archivo sin necesidad de ingresar a nuestro panel de control, esto es una gran ventaja ya que no tenemos que ingresar al administrador de archivos WordPress siendo este delicado para agregar la función de bloquear ChatGPT.

Para agregarlo debemos:

  • Ingresar en el panel lateral de Yoast Seo
  • Entramos en Herramientas
  • Seleccionamos la opción de editor de archivos

Es aquí donde podemos agregar los códigos que hemos visto previamente, en donde indica robots.txt.

Actualizar robot en Yoast SEO

Bloquear ChatGPT en robots.txt desde Rank Math

 

En el caso contrario, si tenemos Rank Math SEO como gestor de SEO, podemos utilizarlo para editar este archivo robots.txt, de la misma forma que lo hemos hecho con el plugin anterior, para ello ingresamos en:

  • Panel lateral de Rank Math
  • Opción de ajustes generales
  • Editar robots.txt

Hay que tener en cuenta que nuestro sitio debe estar indexándose, de lo contrario no nos permitirá editar este archivo y si ya lo tenemos creado en la carpeta raíz de manera manual tampoco nos dejará editarlo por esta opción.

Editar robot.txt desde Rank Math

Bloquear contenido por .htaccess

 

Si queremos protegernos aún más o no confiamos solo en un método de bloquear ChatGPT, podemos realizar también ajustes en nuestro archivo .htaccess WordPress. Esto es un poco más complicado, ya que si tenemos algún error podríamos afectar al funcionamiento del sitio, pero podemos hacerlo siguiendo los pasos que vamos a ver, sin embargo, primero debemos conocer que es un archivo .htaccess.

.htaccess: Este archivo forma parte de la configuración de nuestra web en el servidor; al igual que el archivo anterior, este se encuentra en la raíz de nuestro sitio: Public_html > Dominio. Este no solo se utiliza para bloquear ChatGPT, sino que maneja aspectos del sitio como redirecciones URL, protección de directorios, compresión de archivos, compresión gzip WordPress y más.

Ubicar archivo htaccess en wepanel

Para bloquear ChatGPT y evitar que rastree nuestro sitio, podemos agregar los fragmentos de código necesarios en la ubicación del archivo .htaccess. Es importante recordar que esta es una medida adicional después de bloquear por el archivo robots.txt y tener un respaldo en caso de problemas.

# Bloquear ChatGPT y OpenAI
RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ChatGPT [OR]
RewriteCond %{HTTP_USER_AGENT} ChatGPT-User [OR]
RewriteCond %{HTTP_USER_AGENT} OpenAI
RewriteRule .* - [F]

O lo mismo para el archivo de configuración de NGINX:

# Bloquear ChatGPT y OpenAI
if ($http_user_agent ~* (ChatGPT|ChatGPT-User|OpenAI)) {
return 403;
  }

Bloquear ChatGPT desde .htaccess con Yoast SEO

 

Como en la edición del archivo robots.txt con el plugin de Yoast SEO, contamos con una herramienta de edición de archivos, en este caso, el archivo .htaccess. Para editarlo y bloquear ChatGPT desde este, debemos ingresar en:

  • Panel lateral de Yoast Seo
  • Ingresamos a las Herramientas
  • Seleccionamos la opción de editor de archivos

Una vez dentro debemos bajar un poco la página para ver el editor del archivo .htaccess, recordando que este archivo es delicado y que antes de modificarlo debemos tener un backup WordPress.

Editar archivo htaccess Yoast SEO

Bloquear ChatGPT desde .htaccess con Rank Math

 

De la misma forma sencilla que hemos realizado el ajuste en este plugin para editar el archivo robots.txt, el modificar el archivo .htaccess, es igual de sencillo, para esto simplemente debemos ingresar en:

  • Panel lateral de Rank Math
  • Entramos en Ajustes generales
  • Seleccionamos la opción de Editar .htaccess

Nos mostrará un mensaje en rojo que indica que este archivo es delicado, que para editarlo debemos aceptar que genere una copia de nuestro archivo en caso de algún problema, similar a lo que sería el crear una copia de seguridad en WordPress.

Editar htaccess desde Rank Math

  Conclusiones

 

Como hemos visto, el bloquear ChatGPT por medio del archivo tanto robots.txt como .htaccess puede ser uno de los métodos más efectivos de protección de datos, de esta forma poder limitar el acceso a información que es privada dentro de nuestra página web.

Si decidimos bloquear ChatGPT, tenemos alternativas para hacerlo, desde editar el código desde los archivos en caso de tener experiencia, como el uso de plugins para facilitarnos el trabajo, tanto Yoast SEO como Rank Math, dos plugins muy populares en los que se puede hacer este ajuste que puede ser engorroso para algunas personas.

¿Te ha resultado útil este artículo?

Promo hosting noviembre