Inteligencia artificial
IA

IA entrenada mediante datos de la ‘dark web’: dos caras de una misma moneda

A pesar de lo que a priori pudiera parecer, los investigadores de este proyecto han demostrado intenciones loables arrojando algo de luz sobre nuevas formas de combatir los ciberdelitos.

Cibercrimen

Dos caras de una misma moneda. Al escuchar que los confines más oscuros de Internet alimentan a una inteligencia artificial (IA) basada en grandes modelos del lenguaje (LLM, por sus siglas en inglés), no es de extrañar que haya quien se lleve las manos a la cabeza. Inevitablemente, los tintes negativos asociados a la dark web se imponen en el imaginario colectivo; sin embargo, ¿y si hubiera una forma de extraer todo el potencial de la información que alberga en pro de la sociedad? Esto es precisamente lo que buscaban averiguar un grupo de investigadores surcoreanos mediante DarkBERT, una IA que pretende arrojar algo de luz sobre nuevas formas de combatir el cibercrimen que campa a sus anchas en el lado oculto de la red.

Al igual que otros de su especie, DarkBERT es una inteligencia artificial de tipo LLM; sin embargo, para garantizar el éxito de su entrenamiento, los investigadores tuvieron que ir un paso más allá, puesto que acceder a los datos de la dark web no es tarea sencilla. Para ello, el equipo de investigadores tuvo que conectar a DarkBERT directamente a la red Tor, lo cual les permitió hacerse con la información deseada. Una vez dentro, la inteligencia artificial hizo su magia creando una base de datos de información pura recolectada. Una información extremadamente útil para un sinfín de casos de uso: desde detectar sitios web dedicados a la venta de ransomware o de datos confidenciales hasta la vigilancia de foros.

 

Único en su especie

El equipo capitaneado Seungwon Shin afirma que su nuevo modelo resultó mucho mejor para dar sentido a la web oscura que otros que fueron entrenados para completar tareas similares, incluido ROBERTa, diseñada por Facebook en 2019 para "predecir secciones de texto intencionalmente ocultas”. "Los resultados de nuestra evaluación muestran que el modelo de clasificación basado en DarkBERT supera al de los modelos de lenguaje previamente entrenados conocidos", señalan en el artículo los autores. Aunque el objetivo pueda ser positivo, entrenar una IA en lo más oscuro de la web para que se encargue de vigilarla resulta, como poco, arriesgado.



TE PUEDE INTERESAR...

Accede a la cobertura de nuestros encuentros
 
Lee aquí nuestra revista digital de canal

DealerWorld Digital

 

Forma parte de nuestra comunidad
 
¿Interesado en nuestros foros? 

 

Whitepaper

Documento Pure Storage y Kyndryl INFRAESTRUCTURAS