Jak Meta investuje do technologií
AKTUALIZOVÁNO 19. 1. 2022
Tady je několik příkladů investic do technologií AI, které jsme provedli, abychom zlepšili schopnost našich nástrojů porozumět obsahu:
- Vyvinuli jsme novou architekturu s názvem Linformer, která analyzuje obsah na Facebooku a Instagramu v různých oblastech světa.
- Vytvořili jsme nový systém s názvem Reinforced Integrity Optimizer, který se učí na základě online signálů a zlepšuje naši schopnost detekovat nenávistné projevy.
- Vylepšili jsme nástroj pro hledání shodných obrázků nazvaný SimSearchNet, který naší technologii pomáhá odhalovat drobné rozdíly v obsahu, abychom mohli zasáhnout proti dezinformacím.
- Začlenili jsme jazykové nástroje XLM a XLM-R, které nám pomáhají vytvářet klasifikátory, které rozumí jednomu konceptu ve více jazycích. Když se tedy naše technologie naučí jeden jazyk, může zvládnout i ostatní jazyky líp. To je obzvlášť užitečné u jazyků, které se na internetu používají míň.
- Vytvořili jsme komplexní systém k porozumění podstaty, který analyzuje obsah a pomáhá určit, jestli obsahuje nenávistné projevy.
Otevřená spolupráce, která posouvá hranice AI
Problémy spojené se škodlivým obsahem ovlivňují celý technologický průmysl a společnost jako celek. Proto jsme se rozhodli zpřístupnit naše technologie formou open source, aby je mohli používat i ostatní. Věříme, že otevřený přístup a spolupráce s komunitou AI podnítí výzkum a rozvoj, přinese nové způsoby detekce a prevence škodlivého obsahu a pomůže udržet lidi v bezpečí.
Tady je několik příkladů technologií, které jsme v posledních letech zveřejnili pod open-source licencí. Patří sem i 2 oborové soutěže, které jsme pořádali:
XLM-R
XLM-R je model strojového učení, který se učí v jednom jazyce a poté se používá u jiných jazyků, aniž by k tomu byla potřeba další data pro učení. Protože lidé na Meta platformách zveřejňují obsah ve víc než 160 jazycích, model XLM-R nám umožňuje používat jeden model pro celou řadu jazyků, namísto jednoho modelu pro každý jazyk zvlášť. To nám pomáhá snáz identifikovat nenávistné projevy a další obsah porušující zásady v širokém spektru jazyků a spouštět produkty ve víc jazycích najednou. Zpřístupnili jsme naše modely a kódy, aby mohla výzkumná komunita zlepšit efektivitu svých vícejazyčných modelů.
Cíl: Poskytovat lidem na našich platformách nejlepší možné prostředí bez ohledu na to, jakým jazykem mluví.Linformer
Linformer je architektura transformátoru, která analyzuje miliardy položek obsahu na Facebooku a Instagramu v různých regionech po celém světě. Linformer pomáhá odhalovat nenávistné projevy a obsah podněcující k násilí. Publikovali jsme náš výzkum a zpřístupnili kód k nástroji Linformer, aby mohli své modely vylepšovat i ostatní vědci a inženýři.
Cíl: Vytvořit nový model umělé inteligence, který se učí z textů, obrázků a slovních projevů a efektivně detekuje nenávistné projevy, obchod s lidmi, šikanu a další škodlivé formy obsahu.Deepfakes Detection Challenge
Společně se společností Microsoft, organizací Partnership on AI a akademickými pracovníky z několika univerzit jsme vyhlásili soutěž o technologii, která bude lépe detekovat případy, kdy byla AI použita k pozměnění videa s cílem uvést diváky v omyl. Pro soutěž Deepfakes Detection Challenge jsme vytvořili realistický soubor dat, který v odvětví chyběl, abychom přispěli k účinnější detekci deepfake podvodů.
Cíl: Nabídnout odvětví nové způsoby, jak detekovat a bránit používání médií zmanipulovaných pomocí AI ke klamání lidí.Hateful Memes Challenge
Ve spolupráci se společnostmi Getty Images a DrivenData jsme vytvořili soutěž, jejímž cílem bylo urychlit výzkum v oblasti detekce nenávistných projevů, které kombinují obrázky a text. Náš přínos pro Hateful Memes Challenge spočíval ve vytvoření jedinečné sady dat s víc než 10 000 příklady, které můžou výzkumníci snadno použít při své práci.
Cíl: Podnítit v odvětví tvorbu nových přístupů a metod pro detekci multimodálního nenávistného projevu.