Az ellenőrzési technológia működése
FRISSÍTVE 2024. NOV. 12.
Modellek készítése és előrejelzések
A folyamat a mesterséges intelligenciával foglalkozó csoportjainknál indul. Ők gépi tanulási modelleket hoznak létre, amelyek el tudják végezni az olyan feladatokat, mint például a fényképen látható dolgok felismerése vagy a szöveg megértése. Ezután a szabályaink észleléséért és betartatásáért felelős, integritással foglalkozó csapataink ezekre a modellekre építve hoznak létre konkrétabb modelleket, amelyek előrejelzéseket fogalmaznak meg az emberekkel és a tartalmakkal kapcsolatban. Ezek az előrejelzések segítenek a szabályaink betartatásában.
Egy MI-modell például előrejelzi, hogy egy adott tartalom gyűlöletbeszédnek vagy erőszakos, durva tartalomnak minősül-e. Egy másik rendszer – az ellenőrzési technológiánk – határozza meg, hogy szükséges-e valamilyen intézkedés, például a tartalom törlése, visszaminősítése vagy további ellenőrzés céljából való elküldése egy emberi ellenőrzést végző csapatnak.
Tanulás ismétléssel – emberi ellenőrzés mellett
Amikor új tartalom-ellenőrzési technológiát fejlesztünk ki, elsőként bizonyos jelek keresésére tanítjuk meg. Míg az egyik technológiánk például meztelenséget keres a fényképeken, egy másik a szöveg megértését tanulja meg. Egy új technológia kezdetben alacsony megbízhatósággal állapíthatja meg, hogy adott tartalom sérti-e a szabályainkat.
Ellenőrzést végző csoportjaink ilyenkor meghozhatják a végső döntést, technológiánk pedig tanulhat az egyes emberi döntésekből. Idővel – több ezer emberi döntés tanulmányozásával – a technológia egyre pontosabbá válik.
Szabályaink is változnak az idők során, hogy lépést tudjunk tartani termékünk, a társadalmi normák és a nyelv változásaival. Ennek megfelelően a technológiánk és az ellenőrzést végző csoportok képzése is fokozatos, iteratív folyamat.
Az ismétlődő szabálysértések észleléseA technológia kiválóan alkalmas ugyanazon tartalom újbóli felismerésére – szükség esetén akár több millió alkalommal is. Technológiai eszközeink intézkednek, ha egy új tartalomelem egyezést vagy nagy hasonlóságot mutat egy másik szabálysértő tartalommal. Ez különösen hasznos a vírusszerűen terjedő félretájékoztatási kampányok, mémek és más, rendkívül gyorsan terjedő tartalmak esetében.
Árnyalatos megkülönböztetések
A technológiai eszközök újra és újra meg tudják keresni és eltávolítani ugyanazt a tartalmat. Nagyon nehéz azonban a gépet annyira kifinomulttá tenni, hogy megértse a szóhasználat árnyalásait, illetve hogy kis eltérések miként változtathatják meg a kontextust.
Az első kép a félrevezető tartalom eredeti verziója, amely a közegészségügyi biztonsággal kapcsolatos félretájékoztatást tartalmaz.
A második kép az első képről készült képernyőfelvétel, ezúttal a számítógép menüsávjával a képernyő tetején.
Végül a harmadik kép rendkívül hasonlít az első két képre, de két kisebb szóváltoztatás miatt a főcíme immár pontos, és nem hamis információt tartalmaz.
Ez az emberek számára könnyen érthető, de a technológia nehezen tudja helyesen kezelni. Fennáll a kockázata a túlzott tévedésnek akár egyik, akár másik irányban. Ha a technológia túl agresszív, több millió, a szabályokat nem sértő bejegyzést távolíthat el. Ha nem kellően agresszív, a menüsávos képernyőfelvételt az eredetitől különbözőnek fogja ítélni, és nem tesz lépéseket a tartalommal szemben.
Sok időt szánunk arra, hogy dolgozzunk ezen. Az elmúlt években számos befektetést eszközöltünk annak érdekében, hogy segítsük technológiánkat a finom tartalmi különbségek hatékonyabb észlelésében. A tanulásnak köszönhetően napról napra egyre pontosabbá válik.