Utfordringen ved å avdekke hatefulle ytringer

OPPDATERT 19. JAN. 2022
Hatefulle ytringer er spesielt vanskelig for teknologi og menneskelige gjennomgangsteam å oppdage. Talemåter og nyanser varierer veldig mellom kulturer, språk og regioner. Det hender også at folk deler ord som vanligvis ville være en hatefull ytring, men de gjør det for å øke bevisstheten om problemet eller bruker det som en selvreferanse i et forsøk på å ta tilbake begrepet.
Dette er utfordringer kun ved å påvise hatefulle ytringer i tekst. Mange av de hatefulle ytringene vi finner på Facebook og Instagram, er i bilder eller videoer. Et meme kan for eksempel bruke tekst og bilder sammen for å angripe en bestemt folkegruppe. Dette er en enda større utfordring for teknologi.
hate-speech-image
Innhold som dette blir mer komplisert når folk prøver å unngå å bli oppdaget ved å endre innholdet sitt. For eksempel kan de stave ord feil, unngå visse fraser eller modifisere bildene og videoene sine.
Fremskritt i å bruke kunstig intelligens til å oppdage hatefulle ytringer
Vi har forbedret verktøyene våre for å oppdage hatefulle ytringer i løpet av de siste årene, slik at vi nå fjerner mye av dette innholdet før folk rapporterer det – og i noen tilfeller før noen ser det.
Vi bruker KI til å identifisere bilder og tekst som er identiske med innhold som vi allerede har fjernet som en hatefull ytring. Teknologien vår ser også på reaksjoner og kommentarer for å vurdere hvor likt et innholdselement er.
Disse teknikkene hjelper teknologien vår til å mer nøyaktig kunne påvise hatefulle ytringer, også når meningen ikke er innlysende og når innholdet er endret for å unngå oppdagelse.
Les en inngående analyse i Facebooks KI-blogg