privacidad
Google

Google añade Python a su repertorio de privacidad diferencial

La empresa espera que esta medida facilite a los desarrolladores el uso de la privacidad diferencial para ayudar a mejorar la privacidad en Internet.

privacidad

Google ha anunciado que añade Python a los lenguajes soportados por uno de sus proyectos de código abierto diseñados para reforzar la privacidad en Internet. El proyecto incluye una biblioteca y herramientas para utilizar la privacidad diferencial, una tecnología diseñada para preservar la privacidad de un individuo en grandes conjuntos de datos.

"Anteriormente, nuestra biblioteca de privacidad diferencial estaba disponible en tres lenguajes de programación", ha escrito Miguel Guevara, director de producto de la Oficina de Privacidad y Protección de Datos de Google, en el blog de desarrolladores de la empresa. "Ahora, la hacemos disponible en Python, llegando a casi la mitad de los desarrolladores de todo el mundo. Esto significa que millones de desarrolladores, investigadores y empresas más podrán crear aplicaciones con la tecnología de privacidad líder en el sector, lo que les permitirá obtener información y observar tendencias de sus conjuntos de datos al tiempo que protegen y respetan la privacidad de las personas".

Qué hace la privacidad diferencial

Christopher W. Clifton, profesor de ciencias de la computación en la Universidad de Purdue, explica que muchas personas que realizan proyectos de ciencia de datos se están pasando a Python, por lo que añadir el soporte de este lenguaje al marco de trabajo de Google ampliará la comunidad de interés en la privacidad diferencial. "Se dirige a la gente que pasa mucho tiempo mirando los datos y liberando información sobre ellos", ha explicado.

Uno de los problemas de la divulgación de información sobre grandes conjuntos de datos, incluso cuando los datos de esos conjuntos están anonimizados, es que hay formas de averiguar información sobre individuos en esos datos. "Aunque yo sepa que estás en un conjunto de datos, la privacidad diferencial te protege de que yo conozca información sobre ti a través del análisis de ese conjunto de datos", explica Clifton. "La privacidad diferencial garantiza que, a partir de un análisis estadístico de los datos, no se pueda averiguar con absoluta certeza nada sobre ninguna persona de los datos".

 

Las bibliotecas facilitan a los desarrolladores ofrecer resúmenes de datos

Para el desarrollador medio, sin embargo, utilizar la privacidad diferencial puede ser difícil, señala Jason I. Hong, profesor de informática del Instituto de Seguridad y Privacidad CyLab de la Universidad Carnegie Mellon. "Estas bibliotecas facilitan mucho a los desarrolladores la tarea de ofrecer resúmenes útiles de datos protegiendo la privacidad de las personas", ha afirmado.

"El uso de las bibliotecas de Google sigue requiriendo un buen conocimiento de la privacidad diferencial y de cómo utilizarla", advierte Clifton. "No es que tengamos una solución repentina a todos nuestros problemas de privacidad, pero para las personas que entienden cómo trabajar con la privacidad diferencial y tienen una comprensión de la misma, hace que sea más fácil para ellos producir cosas que lo hagan bien".

 

El censo de EE.UU. utiliza la privacidad diferencial

Hong señala que la privacidad diferencial es útil para analizar grandes conjuntos de datos. "El Censo de EE.UU. está utilizando técnicas de privacidad diferencial para los datos del censo de 2020, con el fin de poder ofrecer estadísticas resumidas y, al mismo tiempo, dificultar a los atacantes la ingeniería inversa de esos resultados y descubrir datos sobre personas concretas".

Además de añadir compatibilidad con Python a su marco de privacidad diferencial, Google ha presentado una nueva herramienta que permite a los desarrolladores ajustar más fácilmente sus implementaciones. La herramienta facilita el ajuste del equilibrio, o épsilon, entre la pérdida de privacidad y el ruido introducido en un conjunto de datos para evitar esa pérdida.

"Para conseguir el nivel correcto de épsilon, a menudo hay que ejecutar el proceso muchas veces. Eso lleva mucho tiempo", dice Guevara en una entrevista. "La herramienta que hemos lanzado te permite simular con una sola pasada la diferencia de utilidad que obtienes con diferentes valores de Epsilon. Así, sólo tienes que ejecutar tu canal una vez".



TE PUEDE INTERESAR...

Partnerzones

Registro:

Eventos:

 



Revistas Digitales IDG

DealerWorld Digital

IDG Research