IA entrenada mediante datos de la ‘dark web’: dos caras de una misma moneda

A pesar de lo que a priori pudiera parecer, los investigadores de este proyecto han demostrado intenciones loables arrojando algo de luz sobre nuevas formas de combatir los ciberdelitos.

También te puede interesar:

Irene Iglesias Álvarez
19 MAY 2023

Dos caras de una misma moneda. Al escuchar que los confines más oscuros de Internet alimentan a una inteligencia artificial (IA) basada en grandes modelos del lenguaje (LLM, por sus siglas en inglés), no es de extrañar que haya quien se lleve las manos a la cabeza. Inevitablemente, los tintes negativos asociados a la dark web se imponen en el imaginario colectivo; sin embargo, ¿y si hubiera una forma de extraer todo el potencial de la información que alberga en pro de la sociedad? Esto es precisamente lo que buscaban averiguar un grupo de investigadores surcoreanos mediante DarkBERT, una IA que pretende arrojar algo de luz sobre nuevas formas de combatir el cibercrimen que campa a sus anchas en el lado oculto de la red.

Al igual que otros de su especie, DarkBERT es una inteligencia artificial de tipo LLM; sin embargo, para garantizar el éxito de su entrenamiento, los investigadores tuvieron que ir un paso más allá, puesto que acceder a los datos de la dark web no es tarea sencilla. Para ello, el equipo de investigadores tuvo que conectar a DarkBERT directamente a la red Tor, lo cual les permitió hacerse con la información deseada. Una vez dentro, la inteligencia artificial hizo su magia creando una base de datos de información pura recolectada. Una información extremadamente útil para un sinfín de casos de uso: desde detectar sitios web dedicados a la venta de ransomware o de datos confidenciales hasta la vigilancia de foros.

Único en su especie

El equipo capitaneado Seungwon Shin afirma que su nuevo modelo resultó mucho mejor para dar sentido a la web oscura que otros que fueron entrenados para completar tareas similares, incluido ROBERTa, diseñada por Facebook en 2019 para "predecir secciones de texto intencionalmente ocultas”. "Los resultados de nuestra evaluación muestran que el modelo de clasificación basado en DarkBERT supera al de los modelos de lenguaje previamente entrenados conocidos", señalan en el artículo los autores. Aunque el objetivo pueda ser positivo, entrenar una IA en lo más oscuro de la web para que se encargue de vigilarla resulta, como poco, arriesgado.

Imprimir Subir

TE PUEDE INTERESAR...

TENDENCIAS

10 aspectos de la seguridad física a tener en cuenta por los CISO

TENDENCIAS

Más de la mitad de las empresas españolas carece de una estrategia de ciberseguridad para la IA

TENDENCIAS

Guerra a los jefes de ciberseguridad tóxicos; cómo ser un mejor CISO

EMPRESAS

Cisco anuncia un servicio de IA para parchear 'exploits' en la nube

CIBERCRIMEN

Microsoft avisa de que Rusia ha comenzado operaciones de influencia para las elecciones estadounidenses

TENDENCIAS

Cómo identificar y proteger la inteligencia artificial en los entornos híbridos

EMPRESAS

Acronis logra el nivel alto del Esquema Nacional de Seguridad

CIBERCRIMEN

Dos asociaciones 'open source' alertan del intento de sabotaje de varios softwares populares

TENDENCIAS

La CISA abre a empresas e individuos su herramienta de análisis de 'malware'

CIBERCRIMEN

Apple detecta una amenaza de 'spyware' en cientos de usuarios de iPhone en más de 90 países

EMPRESAS

Un nuevo fallo de seguridad en Microsoft: empleados expusieron credenciales internas

EMPRESAS

Ivanti rediseñará sus controles de seguridad y la gestión de vulnerabilidades

EMPRENDEDORES

La 'startup' vasca de privacidad de datos Nymiz capta 2,8 millones de euros de financiación

TENDENCIAS

Un grupo de investigadores descubre técnicas de evasión de filtración de datos en SharePoint

TENDENCIAS

El 80% de las empresas españolas ha sufrido un ciberataque en su infraestructura OT

TENDENCIAS

Sólo un 2% de las empresas españolas tiene una ciberseguridad madura, aunque el 74% cree tenerla

CIBERCRIMEN

Un ataque a la Agencia de Protección Ambiental de Estados Unidos expone datos de millones de usuarios

NUEVAS TECNOLOGÍAS

El embarque por reconocimiento facial ya es una realidad en la ruta Madrid-Barcelona de Iberia

LEGISLACIÓN

Los legisladores estadounidenses llegan a un acuerdo sobre privacidad de datos

EMPRESAS

La Fundación Eclipse se une a otros grupos de la industria para garantizar la seguridad del código abierto

Especial Tendencias Ciberseguridad 2024

La industria de la ciberseguridad pisa el acelerador ante las nuevas tendencias tecnológicas

Así mueven ficha los CISO para hacer de la ciberseguridad un aliado

"Se cree que la ciberseguridad y la protección de datos entran en conflicto. No es así, son medios para el mismo fin"

"La lista de 'hackeos' de alto perfil es deprimente, las empresas deben despertar"

"Tenemos que prepararnos tecnológica y matemáticamente para la computación cuántica"

El impacto de la inteligencia artificial generativa en ciberseguridad

Algunos desafíos legales en materia de ciberseguridad para 2024

La ciberseguridad es negocio

No te pierdas...

10 aspectos de la seguridad física a tener en cuenta por los CISO

Más de la mitad de las empresas españolas carece de una estrategia de ciberseguridad para la IA

Guerra a los jefes de ciberseguridad tóxicos; cómo ser un mejor CISO

Cisco anuncia un servicio de IA para parchear 'exploits' en la nube

Microsoft avisa de que Rusia ha comenzado operaciones de influencia para las elecciones estadounidenses

Accede a la cobertura de nuestros encuentros

Lee aquí nuestra revista digital de canal

Forma parte de nuestra comunidad

¿Interesado en nuestros foros?

Whitepaper

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

15 ABR 2024

La volatilidad ha venido para quedarse y las compañías tienen que adaptarse a gran velocidad, con infraestructuras tecnológicas que sean capaces de responder al mismo ritmo. En este contexto, el viaje hacia los modelos como servicio es una tendencia imparable que, junto con sus múltiples beneficios, también presenta retos. Descubre en este documento las principales conclusiones del debate.

Tweets por @csospain