Udfordringen ved at registrere hadefuld retorik

OPDATERET 19. JAN. 2022
Hadefuld retorik er særligt svært for teknologi og menneskelige gennemgangsteam at detektere. Idiomer og nuancer varierer i vid udtrækning på tværs af kulturer, sprog og regioner. Desuden deler folk nogle gange ord, der normalt ville være hadefuld retorik, men de gør det for at øge kendskabet til problemet eller for at bruge det selvhenvisende i et forsøg på at genvinde magten over et ord.
Det er udfordringerne ved blot at detektere hadefuld retorik i tekst. Meget af den hadefulde retorik, vi finder i Facebook-appen og på Instagram, er på billeder eller i videoer. Eksempelvis kan et meme bruge tekst og billeder sammen til at angribe en bestemt gruppe personer. Dette er en endnu større udfordring for teknologi.
hate-speech-image
Indhold som dette bliver mere kompliceret, når folk forsøger at undgå detektering ved at ændre deres indhold. De kan f.eks. finde på at stave ord forkert, undgå bestemte vendinger eller ændre deres billeder og videoer.
Fremgang i brug af kunstig intelligens til detektering af hadefuld retorik
Vi har forbedret vores værktøjer til detektering af hadefuld retorik i løbet af de seneste år, så vi nu fjerner meget af dette indhold, før folk anmelder det og – i nogle tilfælde – før nogen ser det.
Vi bruger AI til at identificere billeder og tekst, der er identisk med indhold, som vi allerede har fjernet for at være hadefuld retorik. Vores teknologi ser også på reaktioner og kommentarer for at vurdere, hvor meget forskelligt indhold ligner hinanden.
Disse teknikker hjælper vores teknologi med mere nøjagtigt at detektere hadefuld retorik, selv når betydningen ikke er åbenlys, eller når indholdet er ændret for at undgå detektering.
Læs en dybdegående analyse på Facebook AI-bloggen