De moeilijkheid van het detecteren van haatdragend taalgebruik

BIJGEWERKT 19 JAN. 2022
Het detecteren van haatdragend taalgebruik is een uitdaging voor zowel technologie als menselijke beoordelingsteams. Idiomen en nuances variëren sterk tussen verschillende culturen, talen en regio's. Ook delen mensen soms woorden die normaal gesproken als haatdragend taalgebruik worden beschouwd, maar dit doen ze om bewustzijn te creëren voor het probleem of om naar zichzelf te verwijzen in een poging de term terug te winnen.
Dat alleen al zijn uitdagingen bij het detecteren van haatdragend taalgebruik in tekst. Veel haatdragend taalgebruik dat we op Facebook en op Instagram vinden, is onderdeel van foto's of video's. Een meme kan bijvoorbeeld zowel tekst als afbeeldingen gebruiken om een bepaalde groep mensen aan te vallen. Dit is een nog grotere uitdaging voor technologie.
hate-speech-image
Dergelijke content wordt nog gecompliceerder wanneer mensen detectie proberen te voorkomen door hun content te wijzigen. Ze spellen woorden bijvoorbeeld verkeerd, vermijden het gebruik van bepaalde zinnen of passen hun afbeeldingen en video's aan.
Voortgang in het gebruik van kunstmatige intelligentie om haatdragend taalgebruik te detecteren
We hebben in de afgelopen jaren onze tools voor het detecteren van haatdragend taalgebruik verbeterd, zodat we nu veel van deze content verwijderen voordat mensen de content rapporteren. In sommige gevallen doen we dat al voordat iemand de content heeft gezien.
We gebruiken AI om afbeeldingen en tekst te identificeren die identiek zijn aan content die we al hebben verwijderd als haatdragend taalgebruik. Onze technologie kijkt ook naar reacties en opmerkingen om te beoordelen hoe vergelijkbaar een contentitem is.
Deze technieken helpen onze technologie om haatdragend taalgebruik nauwkeuriger te detecteren, zelfs als de betekenis niet voor de hand ligt of de content is gewijzigd om detectie te voorkomen.
Lees een uitgebreide analyse in de Facebook AI-blog