El desafĂo de detectar el lenguaje que incita al odio
ÚLTIMA ACTUALIZACIÓN 19 ENE. 2022
El lenguaje que incita al odio es especialmente difĂcil de detectar, tanto para la tecnologĂa como para los equipos de revisiĂłn manual. Las expresiones y los matices varĂan ampliamente segĂşn las culturas, los idiomas y las regiones. Asimismo, las personas en ocasiones comparten palabras que normalmente se considerarĂan lenguaje que incita al odio, pero para dar a conocer el problema o a modo autorreferencial en un esfuerzo por reivindicar el tĂ©rmino.
Estos desafĂos son solo los que supone detectar lenguaje que incita al odio en textos. Mucho de este lenguaje que detectamos en Facebook e Instagram aparece en fotos o videos. Por ejemplo, un meme podrĂa usar texto e imágenes para atacar a un grupo de personas en particular. Este es un desafĂo aĂşn más importante para la tecnologĂa.
Este tipo de contenido se vuelve más complicado de identificar cuando las personas lo modifican para intentar eludir los sistemas de detección. Por ejemplo, pueden escribir palabras incorrectamente, evitar ciertas frases o modificar las imágenes y los videos.
Progreso en cuanto al uso de inteligencia artificial para detectar el lenguaje que incita al odio
Mejoramos nuestras herramientas de detecciĂłn de lenguaje que incita al odio, por lo que ahora eliminamos gran parte de este contenido antes de que se reporte y, en algunos casos, antes de que alguien lo vea.
Usamos inteligencia artificial para identificar texto e imágenes que sean idĂ©nticos al contenido que ya eliminamos por considerarse lenguaje que incita al odio. Nuestra tecnologĂa tambiĂ©n analiza las reacciones y los comentarios para evaluar la similitud de un contenido.
Estas tĂ©cnicas permiten que nuestra tecnologĂa detecte con mayor precisiĂłn este tipo de lenguaje, incluso cuando el significado no es tan evidente o el contenido se modificĂł para evitar que se detecte.
Lee un análisis detallado en el blog sobre inteligencia artificial de Facebook AI