Prevalence
AKTUALIZOVÁNO 6. 3. 2025
Co je prevalence
Prevalence bere v úvahu všechna zobrazení obsahu na Facebooku nebo Instagramu a měří odhadované procento zobrazení porušujícího obsahu. (Další informace o tom, jak definujeme zobrazení, najdete v části „Proč měříme prevalenci zobrazení.“) Tato metrika předpokládá, že dopad způsobený porušujícím obsahem je úměrný počtu zobrazení daného obsahu.
Další možností, jak se dívat na prevalenci, je to, kolika zobrazením porušujícího obsahu jsme zabránit nedokázali — ať už proto, že jsme porušení nezachytili dostatečně brzy, nebo jsme je nezjistili vůbec.
Jak měříme prevalenci
Prevalence porušujícího obsahu se odhaduje pomocí vzorků zobrazení obsahu na Facebooku nebo Instagramu. Počítá se jako podíl odhadovaného počtu zobrazení s obsahem porušujícím zásady a odhadovaného celkového počtu zobrazení obsahu na Facebooku nebo Instagramu. Kdyby byla prevalence nahoty a sexuální aktivity dospělých 0,18 % až 0,20 %, znamenalo by to v průměru 18 až 20 zobrazení obsahu, který porušuje naše zásady ohledně nahoty a sexuální aktivity dospělých, na každých 10 000 zobrazení obsahu.
1 BOD = 10 ZOBRAZENÍ
10 000 ZOBRAZENÍ CELKEM
20 ZOBRAZENÍ PORUŠUJÍCÍHO OBSAHU
Pokud by prevalence byla 0,20 %, znamená to na každých 10 000 zobrazení 20 zobrazení porušujícího obsahu. I když tento počet může být velmi nízký, i minimální množství nevhodného obsahu může mít na lidi výrazný dopad.
K některým typům porušení dochází u našich služeb velmi zřídka. Pravděpodobnost, že si lidé prohlížejí porušující obsah, je velmi nízká. Většinu takového obsahu odebíráme, ještě než jej někdo uvidí. Výsledkem je, že mnohdy nenajdeme dostatek porušujících vzorků, abychom prevalenci přesně odhadli. V těchto případech můžeme odhadnout horní hranici toho, jak často někdo uvidí obsah, který porušuje naše zásady. Pokud je například horní hranice propagování terorismu 0,04 %, znamená to, že na každých 10 000 zobrazení obsahu na Facebooku nebo Instagramu v daném časovém období odhadujeme, že maximálně 4 z těchto zobrazení se týkala obsahu, který porušuje naše zásady ohledně propagování terorismu.
Je důležité mít na paměti, že když je prevalence daného typu porušení tak nízká, že můžeme určit pouze horní hranici, může se tato hranice mezi vykazovanými obdobími měnit o několik setin procentního bodu. Tyto malé změny však nemusí být statisticky významné; v takových případech tyto malé změny nenaznačují skutečný rozdíl v prevalenci daného porušujícího obsahu ve službě.
Proč měříme prevalenci zobrazení
Odhadujeme, jak často je obsah zobrazen, spíše než množství zveřejněného obsahu, protože chceme zjistit, jak moc tento obsah ovlivnil lidi na Facebooku nebo Instagramu. Porušující obsah mohl být zveřejněn jen jednou, ale zobrazen tisíckrát, milionkrát, případně také vůbec. Měření počtu zobrazení porušujícího obsahu spíše než množství zveřejněného porušujícího obsahu lépe odráží dopad na komunitu. Nízká hodnota prevalence může stále znamenat značný dopad na naše služby v důsledku velkého počtu celkových zobrazení obsahu v rámci těchto služeb.
Zobrazení obsahu se počítá, když se obsah objeví na obrazovce uživatele. K zobrazení konkrétně dochází, když někdo:
- Zobrazí příspěvek – i když je v tomto příspěvku více obsahu, zobrazení je přiřazeno k příspěvku.
- Kliknutím zvětší fotku nebo video – zobrazení je přiřazeno k dané fotce nebo videu.
Jak používáme vzorkování k odhadu prevalence
Prevalenci odhadujeme na základě vzorkování zobrazení obsahu na Facebooku nebo Instagramu.
Za tímto účelem kontrolujeme vzorky zobrazení a obsah v nich zobrazený. Pak podle zásad označíme, jestli vzorky porušují zásady, nebo ne. Týmy, které provádějí toto vzorkování, kontrolují celý příspěvek z hlediska možného porušení, a to i v případě, že vzorek zobrazení neukazuje veškerý obsah příspěvku.
Pomocí části těchto vzorků s porušujícím obsahem odhadujeme procento všech zobrazení porušujícího obsahu. Upozorňujeme, že u každého typu porušení zásad nekontrolujeme všechny části Facebooku a Instagramu.
U určitých typů porušení používáme stratifikované vzorkování, což zvyšuje podíl ukázek, pokud kontext naznačuje, že zobrazení obsahu pravděpodobně obsahuje porušení. Pokud by se například porušení zobrazovala častěji ve skupinách než v kanálu příspěvků, odebírali bychom vzorky zobrazení ve skupinách s vyšší pravděpodobností než u zobrazení v kanálu příspěvků. Jedním z důvodů je snížení nejistoty spojené se vzorkováním. Tuto nejistotu vyjadřujeme řadou hodnot, například když uvádíme, že 18 až 20 z každých 10 000 zobrazení je v rozporu s našimi zásadami, pokud jde o nahotu a sexuální aktivitu dospělých. Toto rozmezí odráží 95% interval spolehlivosti. To znamená, že pokud jsme toto měření provedli 100krát s použitím různých vzorků, očekáváme, že skutečné číslo se bude nacházet v rozmezí 95 z těchto 100 měření.
U typů porušení, které se zobrazují velmi zřídka, vyžaduje vzorkování velmi velké množství ukázek obsahu k odhadu přesného měřítka prevalence. V těchto případech můžeme odhadnout pouze horní hranici – to znamená, že jsme si jisti, že prevalence porušujících zobrazení je pod touto hranicí, ale nemůžeme přesně říci, jak hluboko pod ní se nachází. Náš interval spolehlivosti pro tuto horní hranici je také 95 %.
Upozornění
- Lidé, kteří naše vzorky označují, někdy dělají chyby a označí porušení jako neporušující obsah nebo naopak. Relativní míra těchto chyb by mohla ovlivnit měření prevalence. Z tohoto důvodu můžeme nechat vzorek přezkoumat dvěma osobami, aby označování bylo přesné. Pokud se neshodnou, rozhodne třetí člověk.
- V oblastech, jako je násilný a realisticky vyobrazený obsah, kde může být obsah označený jako znepokojivý, náš výpočet prevalence započítává zobrazení daného obsahu, ke kterým došlo před přidáním zakrytí.
- Současné měření prevalence zahrnuje prostředí, která vygenerovala více než 90 % všech zobrazení na Facebooku a Instagramu, a nezahrnuje soukromé konverzace v Messengeru ani Instagram Directu.
- Abychom zajistili reprezentativní měření globální prevalence, provádíme vzorkování a označování obsahu v několika jazycích, a to jak pro Facebook, tak pro Instagram. Jsme si jistí, že tento přístup zajišťuje reprezentativní globální odhad. Neustále pracujeme na zajištění většího rozsahu této metriky.
- Prosazování zásad u obsahu, které provádí kontroloři i technologie, rozšiřujeme do mnoha dalších jazyků.
Prevalence u falešných účtů na Facebooku
Prevalence u falešných účtů na Facebooku je odhad měsíčního procenta aktivních Facebook účtů, u nichž bylo zjištěno, že jsou falešné. Na rozdíl od prevalence u porušení obsahu, prevalence u falešných účtů předpokládá, že dopad na uživatele je úměrný počtu aktivních falešných účtů na Facebooku, i když lidé tyto účty nikdy neuvidí, ani s nimi nemají žádnou interakci.
K odhadu prevalence falešných účtů vybereme uživatele aktivní v daném měsíci a označíme je jako falešné nebo pravé. Uživatele aktivního v daném měsíci (MAU) definujeme jako registrovaného uživatele Facebooku, který se přihlásil a navštívil Facebook prostřednictvím našeho webu nebo mobilního zařízení nebo použil naši aplikaci Messenger (a je také registrovaným uživatelem Facebooku), a to během posledních 30 dní od data měření.