Wskaźnik działań proaktywnych
ZAKTUALIZOWANO 22 LUT 2023
Wskaźnik ten przedstawia odsetek treści i kont, w stosunku do których podjęto działania, które znaleźliśmy i w stosunku do których podjęliśmy działania, zanim zostały nam zgłoszone przez użytkowników. Wykorzystujemy ten wskaźnik jako wyznacznik naszej skuteczności wykrywania naruszeń.
Inwestowanie w technologię uczenia maszynowego jest dla nas kluczowe, aby szybciej wykrywać naruszenia.
Wykorzystujemy uczenie maszynowe na równi z przeszkolonym zespołem specjalistów, którzy dokonują weryfikacji i podejmują działania w stosunku do zawartości naruszającej zasady.
W przypadku niektórych naruszeń wskaźnik proaktywnego wykrywania zawartości stanowiącej potencjalne naruszenie jest wysoki, co oznacza, że znajdujemy większość treści i podejmujemy w stosunku do nich działania, zanim zgłoszą je nam użytkownicy. Dotyczy to w szczególności przypadków, gdy udało nam się stworzyć technologię uczenia maszynowego, która automatycznie wykrywa zawartość, która może naruszać nasze zasady.
Technologia ta jest bardzo obiecująca, ale upłynie jeszcze kilka lat, zanim będzie skuteczna w przypadku wszystkich rodzajów naruszeń. Na przykład wciąż istnieją ograniczenia co do możliwości zrozumienia kontekstu i pewnych niuansów, szczególnie w przypadku treści w formie tekstu. Stwarza to dodatkowe wyzwania, aby móc proaktywnie wykrywać określone rodzaje naruszeń.
Wartości wskaźników mogą wahać się ze względu na czynniki zewnętrzne. Rozważmy na przykład cyberatak, podczas którego spamerzy udostępniają 10 milionów postów zawierających ten sam złośliwy adres URL. Jeśli wykrylibyśmy złośliwy adres URL, zanim zostałby on zgłoszony przez użytkownika, wskaźnik działań proaktywnych powędrowałby do góry podczas ataku, a następnie zmniejszył się, nawet jeśli techniki wykrywania w tym okresie nie uległyby zmianie. Wskaźnik ten może również zwiększyć lub zmniejszyć wartość w zależności od zmiany stosowanych przez nas procedur i narzędzi, np. może on wzrosnąć w miarę poprawy technik wykrywania, ale spaść, jeśli poprawi się system zgłoszeń od użytkowników i gdy rzadziej będziemy polegać na systemie proaktywnego wykrywania naruszeń.
Ponieważ wskaźnik ten zależy od ilości zawartości, co do której podjęto działanie, zastosowanie ma tutaj wiele podobnych czynników. Wskaźnik działań proaktywnych nie oddaje, jak długo trwa wykrycie zawartości naruszającej zasady lub ile razy zawartość ta została wyświetlona, zanim została wykryta. Nie odzwierciedla on również, ilu naruszeń w ogóle nie udało nam się wykryć lub ile razy zawartość ta została wyświetlona. Chociaż odsetek zawartości wykrywanej przez nas proaktywnie może być bardzo wysoki (w niektórych kategoriach sięga nawet 99%), nawet pozostały niewielki odsetek przypadków może mieć istotny wpływ na ludzi.
Sposób obliczania wskaźnika działań proaktywnych
Odsetek ten jest obliczany jako liczba elementów zawartości, w stosunku do których podjęto działanie, a które wykryliśmy i w stosunku do których podjęliśmy działania, zanim zostały zgłoszone przez użytkowników, podzielona przez łączną liczbę elementów zawartości, co do których podjęliśmy działanie.
W przypadku fałszywych kont na Facebooku wskaźnik ten obliczany jest jako odsetek kont zablokowanych na Facebooku, ponieważ były fałszywe, a które wykryliśmy i w stosunku do których podjęliśmy działania, zanim zostały zgłoszone przez użytkowników. Jest on obliczany jako liczba zablokowanych kont, które wykryliśmy i w stosunku do których podjęliśmy działania, zanim zostały zgłoszone przez użytkowników, podzielona przez łączną liczbę kont zablokowanych, ponieważ były fałszywe.
Ograniczenia
Wskaźnik działań proaktywnych jest obliczany przy zastosowaniu ścisłej atrybucji zgłoszeń użytkowników dotyczących treści. Na przykład jeśli podczas weryfikacji zgłoszonej strony, stwierdzimy, że jej zawartość narusza zasady i podejmiemy względem niej jakieś działanie, odnotujemy, że w stosunku do zawartości podjęto działania proaktywnie (o ile nie wpłynęły inne dotyczące jej zgłoszenia).
Zobacz ostatni raport z egzekwowania Standardów społeczności