Jak sestavujeme seznamy nadávek pro konkrétní trhy
Naše zásady komunity definují nadávku jako slovo, které je ze své podstaty urážlivé a slouží k napadání chráněných charakteristik. Do posuzování nadávek se zapojují různé týmy včetně týmů pro zásady, trhy a zapojení zainteresovaných stran. Naše regionální týmy seznamy vytváří tak, že průběžně analyzují kvalitu a kvantitu vyjadřování a kultury v daném regionu nebo komunitě (kterou označujeme jako „trh“). Zkoumáme mimo jiné, jak se slovo v dané lokalitě běžně používá, jak často se na našich platformách objevuje a jaké významy se s ním pojí. Týmy při tom můžou využívat znalosti kultury získané z novinových článků, akademických studií a dalších lingvistických výzkumů. Našim regionálním týmům pomáhají další experti, kteří se specializují na zásady a procesy. Doplněn je také kulturní kontext (novinové články, akademické články apod.) a je nutné shromáždit a posoudit minimálně 50 položek obsahu zahrnujících daný výraz. Po dokončení analýzy naše týmy zaměřené na zásady projdou všechny podklady poskytnuté místními trhy a obsah je posouzen podle příslušných zásad společnosti Meta. Týmy zaměřené na daný trh zodpovídají za to, aby byly relevantní seznamy nadávek co nejúplnější a nejaktuálnější.
Analyzujeme taky způsoby, jakými se určitá slova na našich platformách používají, abychom mohli určit, do jaké míry splňují definici nadávky. Z používání slov na našich platformách může například vyplývat, že je třeba posoudit některé nadávky zahrnující dříve neidentifikované varianty nebo související termíny. Abychom tyto případy identifikovali, analyzujeme používání nadávek napříč našimi platformami. Seznamy nadávek a zásady kromě toho zahrnují pokyny, za jakých okolností může být použití dané nadávky přípustné, třeba když se zjevně použije ve vztahu k vlastní osobě, v alternativním významu, při diskuzi o používání nadávek, při informování o nadávkách, při odsouzení používání nadávky nebo v explicitně pozitivním významu.
Jak prosazujeme seznamy nadávek pro konkrétní trhy
Různé národy a kultury můžou používat stejný jazyk, ale nadávky se často týkají specifické oblasti nebo komunity (kterou označujeme jako trh). Proto používáme seznamy nadávek, které jsou specifické pro konkrétní trhy, ne jen pro konkrétní jazyky. Naši kontroloři pokrývají různé oblasti napříč mnoha jazyky (aby co nejlépe pokryli všechny dialekty) a veškeré oblasti porušení zásad. Tito kontroloři mají přiřazené fronty podle toho, na jaký jazyk a typ porušení jsou zaměření. Dokážou proto kvalifikovaně posoudit, které seznamy nadávek budou nejrelevantnější pro příslušnou frontu obsahu. Moderování obsahu se směruje tak, že se posoudí vhodný kontrolor nebo kontroloři pro daný obsah na základě jazyka i regionu. Při komplexním směrování však zpravidla hraje větší roli jazyk. Fronty pro trhy v oblasti Jižního kužele například pokrývají obsah pocházející z Chile, Uruguaye, Argentiny a Paraguaye, kde je primárním jazykem španělština. Každý algoritmus pro řazení do fronty na daném trhu má taky podmínku, která se označuje jako „catch all“. Tato podmínka umožňuje, aby se všechny úlohy v jazyce nepřiřazeném k zemím, které pokrývá daný trh, automaticky zařadily k trhům, které jsou pro daný jazyk nejrelevantnější. Například úlohy pro francouzštinu, které mají zeměpisný původ v trhu Jižního kuželu (kam patří například Argentina), by se zařadily do fronty pro kontrolu k francouzským trhům a naopak. Když se objeví nadávka v jazyce, který se liší od zbytku obsahu, naše technologie pro hromadnou kontrolu ji vyhodnotí jako nadávku na seznamu pro jiný trh. Tím se nadávka ve všech frontách pro trhy označí jako potenciálně nevhodný jazyk.
Algoritmy řazení do fronty berou v úvahu jak jazyk, tak zemi, protože nadávky můžou mít určitá omezení (alternativní způsoby použití, které jsou v pořádku) související s aktuálním světovým děním a kontextem daného trhu. Kontext trhu je pro kontrolory důležitý, protože podle něj určují, jestli se slovo objevuje v přípustném způsobu použití. Pokud chybí kontext a neexistuje žádný jiný přípustný případ použití, budeme obsah považovat za nevhodný.