Neue Möglichkeiten zur Durchsetzung von Content-Richtlinien durch KI
AKTUALISIERT 19.03.2026
Wir haben schon immer eine Kombination aus Technologie und menschlicher Prüfung eingesetzt, um Inhalte zu überprüfen und die Einhaltung unserer Gemeinschaftsstandards durchzusetzen. Wie kürzlich angekündigt testen wir die Integration von fortschrittlicheren KI-Systemen in unsere bestehenden Prozesse zur Durchsetzung von Inhalten. Damit möchten wir die positiven Ergebnisse weiter ausbauen, die wir mit den Änderungen zur Reduzierung von Fehlern im letzten Jahr erzielt haben. Diese aktualisierten Systeme können gravierendere Inhaltsverstöße und illegale Inhalte finden, mehr Betrugsversuche unterbinden sowie schneller auf reale Ereignisse reagieren.
Doch auch wenn wir mehr neue Technologien nutzen, um die Grenzen des Möglichen zu skalieren, bleiben die Menschen immer im Mittelpunkt unseres Ansatzes. Unsere Expert*innen sind weiterhin für das Entwerfen und Erstellen unserer Richtlinien, das Entwickeln, Trainieren und Bewerten unserer KI-Systeme und das Messen der Performance verantwortlich. Die komplexesten Entscheidungen mit der größten Auswirkung bleiben also in menschlichen Händen. Es ist eine Weiterentwicklung unserer Idee, die Skalierbarkeit und die Fähigkeiten fortschrittlicher KI mit dem Fachwissen und dem Urteilsvermögen von Menschen zu verschmelzen. Beide Ansätze stärken sich gegenseitig und sorgen so auf unseren Plattformen für die Sicherheit unserer Nutzer*innen.
Was ändert sich und was nicht?
Gestaffelte, vorsichtige Einführung
Wir gehen diese Umstellung langsam und sorgfältig an, um bei der Einführung keine Fehler zu machen. Jedes KI-Modell wird vor seinem Einsatz in mehreren Phasen gründlich getestet. Nur wenn die Technologie in allen unseren Tests konsequent besser abgeschnitten hat als unsere bestehenden Systeme, werden wir zu einer Durchsetzung übergehen, die in erster Linie durch KI erfolgt.
Das ist neu: Mehr unterstützte Sprachen und verbesserte Erkennung
Diese fortschrittlichen KI-Systeme decken Sprachen ab, die von 98 % der Menschen im Internet gesprochen werden – weit mehr als die 80 Sprachen, die wir bisher abdecken konnten. Dadurch können wir unsere Richtlinien auf Milliarden von Inhalten noch genauer und konsistenter anwenden. Diese Systeme können auch mehr Kontext und kulturelle Nuancen – zum Beispiel kleinere Subkulturen – verstehen, beispielsweise sich schnell verändernde bzw. regionale Code-Wörter, Emoji-Bedeutungen und Slang.
Erste Tests haben bereits vielversprechende Ergebnisse bei der Erkennung dieser Nuancen für die Durchsetzung erzielt. So haben unsere KI-Systeme eine gefälschte Website identifiziert, die sich als eine legitime Sportartikel-Webseite tarnte. Sie erkannten, dass das echte Logo zusammen mit ungewöhnlich niedrigen Preisen und einer verdächtigen Webadresse verwendet wurde.
Das bleibt gleich: Die grundlegenden Prinzipien der Durchsetzung
- Der Mensch bleibt im Mittelpunkt: Menschen spielen auch weiterhin eine Schlüsselrolle in unserem Ansatz zur Durchsetzung von Content-Richtlinien. Unsere fachkundigen Teams sind die Architekt*innen der Durchsetzung mit KI von Meta: Sie erarbeiten die Richtlinien, trainieren die Modelle, validieren die Leistung und treffen wichtige Entscheidungen mit weitreichenden Auswirkungen, wie z. B. die finale Entscheidung über Einsprüche gegen die Kontodeaktivierung und die Unterrichtung von Strafverfolgungsbehörden, sofern dies gesetzlich vorgeschrieben ist.
- Gemeinschaftsstandards: Unsere Gemeinschaftsstandards ändern sich durch diese Umstellung nicht. Sie geben weiterhin vor, was auf unseren Plattformen erlaubt ist und was nicht. Lediglich die Art und Weise, wie wir diese Richtlinien durchsetzen, ändert sich.
- Meldungen und Einsprüche: Du kannst weiterhin Inhalte melden, die deiner Meinung nach gegen unsere Richtlinien verstoßen. Und wenn wir Maßnahmen gegen deine Inhalte oder dein Konto ergreifen, kannst du immer noch Einspruch gegen diese Entscheidung erheben.
So funktioniert’s
Unser Ansatz kombiniert die Fähigkeiten von KI mit menschlichem Fachwissen, das während des gesamten Prozesses einbezogen wird.
Einsatz nur nach strengen Tests
Bevor ein KI-System reale Entscheidungen im Rahmen der Durchsetzung trifft, wird es rigoros getestet und es werden Sicherheitsvorkehrungen eingerichtet. Wir vergleichen die Entscheidungen der Technologie mit den Entscheidungen unserer erfahrensten Review-Mitarbeiter*innen und setzen die Technologie erst ein, wenn sie nachweislich und kontinuierlich besser abschneidet als unsere bisherigen Methoden zur Durchsetzung unserer Content-Richtlinien.
Klare Qualitätsstandards
Jedes Modell muss bestimmte Benchmarkwerte für die Genauigkeit erreichen, bevor es eingesetzt werden kann. Wir bewerten die Performance, um Konsistenz, Effektivität, Fairness und Genauigkeit zu gewährleisten. Nur so können wir tatsächliche Verstöße richtig identifizieren und zwischen unzulässigen und zulässigen Inhalten unterscheiden.
Kontinuierliche Überwachung
Sobald ein Modell in der Praxis angewendet wird, wird es kontinuierlich bewertet. Wir tracken die Genauigkeit, überwachen die Performance auf unerwartete Veränderungen und können bei Bedarf schnell Optimierungen oder Anpassungen bei den Modellen vornehmen. Unsere Systeme sind für schnelle Iterationen und Korrekturen ausgelegt. Teams und Technologien überprüfen Tendenzen, um Probleme frühzeitig zu erkennen.
Menschliche Expertise in jeder Phase
Die Richtlinien werden von Menschen entwickelt. Die KI wird von Menschen trainiert. Die Performance wird von Menschen gemonitort. Und die differenziertesten, komplexesten Entscheidungen mit der größten Auswirkung werden von Menschen getroffen. KI ermöglicht eine bessere und skalierte Durchsetzung und erhöht die Konsistenz – Menschen sorgen für das nötige Urteilsvermögen und die Aufsicht über das System.
Performance in den verschiedenen Richtlinienbereichen
Unsere KI-Modelle zeigen bereits in der frühen Testphase Verbesserungen in mehreren Bereichen unserer Richtlinien:
Betrug und Scams
Eine KI-Lösung, die Betrüger*innen daran hindern soll, Personen zur Preisgabe ihrer Anmeldedaten zu bringen, deckte 5.000 Betrugsversuche pro Tag auf und unterband sie. Kein Review-Team hatte diese zuvor erkannt.
Unzulässige nicht jugendfreie Inhalte
KI-Systeme, die darauf trainiert sind, Verstöße im Zusammenhang mit sexuell motivierter Kontaktaufnahme durch Erwachsene zu erkennen, haben mehr als doppelt so viele Verstöße erkannt als Mitarbeiter*innen. Gleichzeitig sank die Fehlerquote um 60 %. Das bedeutet, dass wir gefährliche Inhalte schneller finden und entfernen und zugleich mehr Menschen vor falschen Treffern schützen.
Nachahmung
KI konnte die Zahl der Meldungen von Nutzer*innen zu nachgeahmten Prominenten um 80 % reduzieren. Anstatt nur Namen abzugleichen, erkennt die KI, wenn jemand eine Person des öffentlichen Lebens nachahmt, indem sie mehr Kontext analysiert – Profildetails, Beitragsmuster und zugehörige Eigenschaften, die auf eine Nachahmung hindeuten.
Ausblick
Diese Umstellung erfolgt phasenweise, wobei bei jedem Schritt sorgfältig getestet wird. Wir veröffentlichen Daten zur Durchsetzung in unserem Bericht zur Durchsetzung der Gemeinschaftsstandards und werden weiterhin unsere Erkenntnisse teilen – sowohl die Erfolge als auch die Herausforderungen –, während die KI-gestützte Durchsetzung auf immer mehr Richtlinienbereiche ausgeweitet wird. Außerdem planen wir, unser global tätiges, spezialisiertes Meta-Team mit umfassendem Fachwissen über die Anwendung unserer Standards und Richtlinien zu stärken.
Transparenz in Bezug auf diese Umstellung und unsere Durchsetzungsprozesse ist wichtig. Weitere Informationen dazu, wie wir aktuell bei Verstößen vorgehen, findest du unter Ergreifen von Maßnahmen. Einzelheiten zu unseren Richtlinien findest du in unseren Gemeinschaftsstandards. Bei der Weiterentwicklung unserer Richtlinien tauschen wir uns regelmäßig mit einer Vielzahl von Stakeholdern aus. Das werden wir auch bei dieser Umstellung tun. Wir arbeiten mit Regulierungsbehörden, externen Expert*innen und dem Oversight Board zusammen und holen Feedback zu unserem Ansatz ein.
Unser Ansatz ist so gestaltet, dass er sich anpasst – an neue Bedrohungen, an die Weiterentwicklung von Slang und an neue Herausforderungen wie die kodierte Sprache bei Drogenverkäufen. Außerdem basiert sie auf dem Prinzip, dass die besten Ergebnisse durch die Kombination hochentwickelter Technologie mit menschlichem Urteilsvermögen erzielt werden.