Vihapuheen havaitsemisen haasteellisuus

PÄIVITETTY 19.1.2022
Teknologian ja ihmisistä koostuvien tarkistustiimien on erityisen vaikea havaita vihapuhetta. Idiomit ja nyanssit voivat erota merkittäväsi toisistaan eri kulttuureissa, eri kielissä ja eri alueilla. Lisäksi käyttäjät voivat joskus pyrkiä lisäämään tietoisuutta jostain ongelmasta jakamalla sanoja, jotka olisivat tavallisesti vihapuhetta. He voivat myös viitata sanalla itseensä ja pyrkiä näin ollen saamaan käsitteen takaisin itselleen.
Edellä luetellut ongelmat liittyvät ainoastaan vihapuheen havaitsemiseen tekstistä. Facebookissa ja Instagramissa on paljon kuva- ja videomuodossa olevaa vihapuhetta. Esimerkiksi meemeissä voidaan hyökätä tiettyä ihmisryhmää vastaan sekä tekstin että kuvien avulla. Kyseessä on vielä suurempi haaste teknologian kannalta.
hate-speech-image
Tällainen sisältö on vielä haastavampaa, jos käyttäjät pyrkivät välttämään sisältönsä havaituksi tulemista muuttamalla sitä. He voivat esimerkiksi kirjoittaa sanoja väärin, välttää tiettyjä ilmaisuja tai muokata kuviaan tai videoitaan.
Edistyksemme tekoälyn käyttämisessä vihapuheen havaitsemiseen
Olemme kehittäneet vihapuheen havaitsemiseen tarkoitettuja työkalujamme viime vuosien aikana. Sen ansiosta poistamme suuren osan sisällöstä ennen kuin käyttäjät ilmiantavat sen. Jossain tapauksissa poistamme sisällön jopa ennen kuin kukaan ehtii nähdä sitä.
Tunnistamme tekoälyn avulla kuvia ja tekstejä, jotka ovat samanlaisia kuin jo poistamamme vihapuhesisältö. Teknologiamme tarkastelee myös reaktioita ja kommentteja arvioidessaan, kuinka samankaltaista sisältö on.
Tekniikoiden ansiosta teknologiallamme voidaan havaita vihapuhetta täsmällisemmin, vaikka merkitys ei olisikaan ilmeinen ja sisältöä olisikin muutettu havaituksi tulemisen välttämiseksi.
Lue seikkaperäinen analyysi Facebookin tekoälyblogista