Compartir datos empresariales sensibles con ChatGPT podría ser arriesgado

ChatGPT y otros grandes modelos lingüísticos similares aprenden de los datos que les proporcionan, por lo que compartir información empresarial confidencial con ‘chatbots’ de inteligencia artificial entraña grandes riesgos.

ChatGPT no almacena los datos de entrada de los usuarios, ¿verdad?

El Centro Nacional de Ciberseguridad del Reino Unido (NCSC, por sus siglas en inglés) compartió más información sobre este asunto en marzo, afirmando que ChatGPT y otros grandes modelos lingüísticos (LLM, por sus siglas en inglés) no añaden actualmente información automáticamente de las consultas a los modelos para que otros puedan consultarlos. Es decir, incluir información en una consulta no implica que esos datos potencialmente privados se incorporen al LLM. "Sin embargo, la consulta será visible para la organización que proporciona el LLM (en el caso de ChatGPT, para OpenAI)", escribió.

"Esas consultas se almacenan y casi con toda seguridad se utilizarán para desarrollar el servicio o modelo LLM en algún momento. Esto podría significar que el proveedor de LLM (o sus socios/contratistas) puedan leer las consultas e incorporarlas de algún modo en futuras versiones", añadía. Otro riesgo que aumenta a medida que más organizaciones producen y utilizan LLM es que las consultas almacenadas en línea puedan ser pirateadas, filtradas o puestas accidentalmente a disposición del público, escribió el NCSC. En definitiva, existe un verdadero motivo de preocupación en relación con la introducción y el uso de datos empresariales confidenciales en ChatGPT, aunque es probable que los riesgos sean menos generalizados de lo que indican algunos titulares.

Riesgos probables de introducir datos confidenciales en ChatGPT

Los LLM muestran un comportamiento emergente denominado aprendizaje en contexto. Durante una sesión, a medida que el modelo recibe datos, puede condicionarse a realizar tareas basadas en el contexto contenido en esos datos. "Este es probablemente el fenómeno al que se refiere la gente cuando se preocupa por la fuga de información. Sin embargo, no es posible que la información de la sesión de un usuario se filtre a la de otro", explica a CSO Andy Patel, investigador senior de WithSecure. "Otra preocupación es que las indicaciones introducidas en la interfaz de ChatGPT se recojan y se utilicen en futuros datos de entrenamiento".

Aunque es válido preocuparse de que los chatbots ingieran y luego regurgiten información sensible, sería necesario entrenar un nuevo modelo para incorporar esos datos, dice Patel. Entrenar a los LLM es un procedimiento caro y largo, y afirma que le sorprendería que se entrenara un modelo con los datos recopilados por ChatGPT en un futuro próximo. "Si finalmente se crea un nuevo modelo que incluya los avisos recogidos por ChatGPT, nuestros temores se centran en los ataques de inferencia de pertenencia. Estos ataques podrían revelar números de tarjetas de crédito o información personal que figurase en los datos de entrenamiento. Sin embargo, no se ha demostrado ningún ataque de inferencia de miembros contra los LLM de ChatGPT y otros sistemas similares". Esto implica que es muy poco probable que los futuros modelos sean susceptibles de sufrir ataques de inferencia de miembros, aunque Patel admite que es posible que la base de datos que contiene los mensajes guardados sea pirateada o filtrada.

Los vínculos de terceros con la IA podrían exponer los datos

Es más probable que los problemas surjan de proveedores externos que no declaran explícitamente sus políticas de privacidad, por lo que usarlos con herramientas y plataformas que de otro modo serían seguras puede poner en riesgo cualquier dato que sería privado, defiende Wicus Ross, investigador senior de Seguridad de Orange Cyberdefense. "Las plataformas SaaS como Slack y Microsoft Teams tienen límites claros de datos y procesamiento y un bajo riesgo de que los datos queden expuestos a terceros. Sin embargo, estas líneas claras pueden difuminarse rápidamente si los servicios se aumentan con complementos de terceros o bots que necesitan interactuar con los usuarios, independientemente de si están vinculados a la IA", afirma. "En ausencia de una declaración explícita clara en la que el procesador de terceros garantice que la información no se filtrará, debes asumir que ya no es privada".

Aparte de los datos sensibles que comparten los usuarios habituales, las empresas también deben ser conscientes de los ataques de inyección puntual que podrían revelar las instrucciones previas proporcionadas por los desarrolladores al ajustar la herramienta o hacer que ignore las directivas programadas previamente, explica a CSO Neil Thacker, CISO de Netskope para EMEA. "Ejemplos recientes incluyen bromistas de Twitter cambiando el comportamiento del bot y problemas con Bing Chat, donde los investigadores encontraron una manera de hacer que ChatGPT revele instrucciones previas probablemente escritas por Microsoft que deberían estar ocultas”.

Controle qué datos se envían a ChatGPT

Los datos confidenciales representan actualmente el 11% de lo que los empleados pegan en ChatGPT, y la empresa media filtra datos confidenciales a ChatGPT cientos de veces cada semana, según Cyberhaven. "ChatGPT está pasando del bombo publicitario al mundo real y las organizaciones están experimentando con la implementación práctica en toda su empresa para unirse a sus otras herramientas basadas en ML/AI, pero es necesario aplicar cierta precaución, especialmente cuando se trata de compartir información sensible", refiere Thacker. Hay que tener en cuenta aspectos como la propiedad de los datos y el impacto potencial si la organización que los aloja sufre una brecha". Como ejercicio sencillo, los profesionales de la seguridad de la información deberían, como mínimo, ser capaces de identificar la categoría de datos potencialmente accesibles en caso de violación de estos servicios”.

En última instancia, es responsabilidad de las empresas asegurarse de que sus usuarios son plenamente conscientes de qué información debe y no debe revelarse a ChatGPT. Las organizaciones deben tener mucho cuidado con los datos que deciden enviar en las solicitudes, dice el NCSC: "Debes asegurarte de que aquellos que quieran experimentar con los LLM puedan hacerlo, pero de una manera que no ponga en riesgo los datos de la organización”.

Advertir a los trabajadores sobre el peligro potencial

Sin embargo, identificar y controlar los datos que los empleados envían a ChatGPT no está exento de dificultades, advirtió Cyberhaven. "Cuando los trabajadores introducen datos de la empresa en ChatGPT, no cargan un archivo, sino que copian y pegan el contenido en su navegador web. Muchos productos de seguridad están diseñados para proteger los archivos (que están etiquetados como confidenciales) de su carga, pero una vez que el contenido se copia fuera del archivo, son incapaces de seguirle la pista", insistió. Es más, los datos de la empresa que van a ChatGPT a menudo no contienen un patrón reconocible que las herramientas de seguridad buscan, como un número de tarjeta de crédito o de la Seguridad Social, dijo Cyberhaven. "Sin saber más sobre su contexto, las herramientas de seguridad actuales no pueden diferenciar entre alguien que introduce el menú de la cafetería y los planes de fusiones y adquisiciones de la empresa".

Para mejorar la visibilidad, las organizaciones deben implementar políticas en sus pasarelas web seguras (SWG) para identificar el uso de herramientas de IA y también pueden aplicar políticas de prevención de pérdida de datos (DLP) para detectar qué datos se envían a estas herramientas, incide Thacker. Las organizaciones deben actualizar las políticas de protección de la información para asegurarse de que los tipos de aplicaciones que son manejadores aceptables de datos confidenciales están bien documentados, interviene Michael Covington, vicepresidente de Estrategia de cartera en Jamf. "El control de ese flujo de información comienza con una política bien documentada e informada", afirma. "Además, las organizaciones deben explorar cómo pueden utilizar estas nuevas tecnologías para mejorar sus negocios de una manera reflexiva. No hay que huir de estos servicios por miedo e incertidumbre, sino dedicar algo de personal a explorar nuevas herramientas que muestren potencial, de modo que se puedan comprender los riesgos desde el principio y garantizar que se dispone de las protecciones adecuadas cuando los primeros usuarios finales quieran empezar a utilizar las herramientas”.

Imprimir Subir

TE PUEDE INTERESAR...

LEGISLACIÓN

Estas son las mayores sanciones impuestas a empresas por brechas de datos

TENDENCIAS

El número de incidentes gestionados por INCIBE crece un 24% en 2023

ENTREVISTAS

"Tener demasiadas soluciones de seguridad puede suponer un freno para la digitalización"

TENDENCIAS

'Electrosmog': ¿son los límites a la radiación electromagnética demasiado laxos?

EMPRESAS

Veeam anuncia la adquisición de Coveware

TENDENCIAS

10 aspectos de la seguridad física a tener en cuenta por los CISO

TENDENCIAS

Más de la mitad de las empresas españolas carece de una estrategia de ciberseguridad para la IA

TENDENCIAS

Guerra a los jefes de ciberseguridad tóxicos; cómo ser un mejor CISO

EMPRESAS

Cisco anuncia un servicio de IA para parchear 'exploits' en la nube

CIBERCRIMEN

Microsoft avisa de que Rusia ha comenzado operaciones de influencia para las elecciones estadounidenses

TENDENCIAS

Cómo identificar y proteger la inteligencia artificial en los entornos híbridos

EMPRESAS

Acronis logra el nivel alto del Esquema Nacional de Seguridad

CIBERCRIMEN

Dos asociaciones 'open source' alertan del intento de sabotaje de varios softwares populares

TENDENCIAS

La CISA abre a empresas e individuos su herramienta de análisis de 'malware'

CIBERCRIMEN

Apple detecta una amenaza de 'spyware' en cientos de usuarios de iPhone en más de 90 países

EMPRESAS

Un nuevo fallo de seguridad en Microsoft: empleados expusieron credenciales internas

EMPRESAS

Ivanti rediseñará sus controles de seguridad y la gestión de vulnerabilidades

EMPRENDEDORES

La 'startup' vasca de privacidad de datos Nymiz capta 2,8 millones de euros de financiación

TENDENCIAS

Un grupo de investigadores descubre técnicas de evasión de filtración de datos en SharePoint

TENDENCIAS

El 80% de las empresas españolas ha sufrido un ciberataque en su infraestructura OT

Especial Tendencias Ciberseguridad 2024

La industria de la ciberseguridad pisa el acelerador ante las nuevas tendencias tecnológicas

Así mueven ficha los CISO para hacer de la ciberseguridad un aliado

"Se cree que la ciberseguridad y la protección de datos entran en conflicto. No es así, son medios para el mismo fin"

"La lista de 'hackeos' de alto perfil es deprimente, las empresas deben despertar"

"Tenemos que prepararnos tecnológica y matemáticamente para la computación cuántica"

El impacto de la inteligencia artificial generativa en ciberseguridad

Algunos desafíos legales en materia de ciberseguridad para 2024

La ciberseguridad es negocio

No te pierdas...

Estas son las mayores sanciones impuestas a empresas por brechas de datos

El número de incidentes gestionados por INCIBE crece un 24% en 2023

Acacio Martín (Fortinet): "Tener demasiadas soluciones de seguridad puede suponer un freno para la digitalización"

'Electrosmog': ¿son los límites a la radiación electromagnética demasiado laxos?

Veeam anuncia la adquisición de Coveware

Accede a la cobertura de nuestros encuentros

Lee aquí nuestra revista digital de canal

Forma parte de nuestra comunidad

¿Interesado en nuestros foros?

Whitepaper

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

15 ABR 2024

La volatilidad ha venido para quedarse y las compañías tienen que adaptarse a gran velocidad, con infraestructuras tecnológicas que sean capaces de responder al mismo ritmo. En este contexto, el viaje hacia los modelos como servicio es una tendencia imparable que, junto con sus múltiples beneficios, también presenta retos. Descubre en este documento las principales conclusiones del debate.

Tweets por @csospain