コンテンツ施行をAIで変革

更新日 2026/03/19
Metaでは常に、コンテンツの審査とコミュニティ規定の施行に、テクノロジーと人間の両方を併用してきました。先般発表しましたとおり、Metaでは、より高度なAIシステムをコンテンツに対する施行措置の既存のプロセスに統合する実験を行っています。間違いを減らすために昨年行われた変更から得られた良好な結果を引き続き基礎とすることを目指しており、アップデートしたシステムでは、より重大なコンテンツ違反や違法コンテンツを見つけ、より多くの詐欺行為を差し止め、現実世界の出来事により迅速に対応することができます。
しかし、新しいテクノロジーによって可能な範囲を拡大していく中でも、人間は引き続き取り組みの中心であり続けます。 ポリシーの作成と策定、AIシステムの設計・トレーニング・評価、パフォーマンス測定は引き続きMetaの専門家が担当し、最も複雑で影響の大きい決定を下す役割を担います。これは、高度なAIの規模と能力を人間の専門知識と判断力と組み合わせ、互いを強化しながら、Metaのプラットフォーム上で人々の安全を守るための進化です。
変更点とこれまでと同じ点
段階的かつ慎重な展開
この移行に対して時間をかけて慎重に取り組んでおり、展開が十分に検討され、計画的に進められるよう配慮しています。すべてのAIモデルは、展開前に厳格な複数段階のテストを受けます。すべてのテストにおいて既存システムより一貫して優れたパフォーマンスを示した場合にのみ、AIファーストのコンテンツ施行へ移行します。
変更点: 対応言語の拡大と検出の向上
これらの高度なAIシステムは、オンライン利用者の98%が使用する言語をカバーしており、従来の約80言語のカバー範囲を大きく上回ります。これにより、数十億件のコンテンツにわたって、ポリシーをより正確かつ一貫して適用できるようになります。これらのシステムは、より多くの文脈や文化的なニュアンスを理解することもできます。これには、ニッチなサブカルチャーや、急速に変化する地域特有の隠語、絵文字の意味、スラングなどが含まれます。
初期テストでは、コンテンツ施行においてこうしたニュアンスを特定する点で有望な結果がすでに示されています。例えば、実在するロゴが使用されているにもかかわらず異常に低い価格や不審なウェブアドレスが使われていることを検知することで、正規のウェブアドレスを装って人気のスポーツ用品店になりすます偽サイトを、MetaのAIシステムが検出したケースがあります。
これまでと同じ点: 施行の基本原則
  • 人間が引き続き中心: コンテンツ施行に対するMetaのアプローチにおいて、引き続き重要な役割を果たすのは人間です。専門家チームは、AIによるコンテンツ施行の設計を担い、ポリシーの策定、モデルのトレーニング、パフォーマンスの検証を行います。また、アカウント停止に対する異議申し立てに関する最終判断や、法令で義務付けらる場合の法執行機関への通知など、リスクが高く影響の大きい決定も担当します。
  • コミュニティ規定: コミュニティ規定はこの移行の一環として変更されるものではなく、Metaのプラットフォーム全体で何が許可され、何が許可されないかを定義し続けます。唯一変わるのはポリシーの施行方法だけです。
  • 報告と異議申し立て: 利用者は、Metaのポリシーに違反していると思われるコンテンツを引き続き報告できます。Metaがコンテンツまたはアカウントに対して措置を講じた場合でも、その決定に対して引き続き異議を申し立てることができます。
しくみ
Metaは、プロセス全体を通じてAIの能力と人間の専門知識を統合し、それらを組み合わせたアプローチを採用しています。
導入前の厳格なテスト
AIシステムが実際のコンテンツ施行の判断を行う前に、Metaはそれを厳格にテストし、セーフガードを組み込みます。AIの判断を最も経験豊富な審査担当者の判断と比較し、現在のコンテンツ施行の方法よりも一貫して優れた成果が確認された場合にのみ、それを展開します。
明確な品質基準
すべてのモデルは、展開前に特定の精度基準を満たす必要があります。一貫性、有効性、公平性、正確性を確保するためにパフォーマンスを評価し、実際の違反を正しく特定できているか、また違反コンテンツと違反していないコンテンツを適切に区別できているかを確認します。
継続的なモニタリング
導入後は、すべてのモデルを継続的に評価します。精度を追跡し、パフォーマンスに予期しない変化がないかを監視し、問題が発生した場合にはモデルを迅速に調整または改良します。Metaのシステムは、迅速なイリテーションと修正を前提に設計されており、チームとテクノロジーの両面でトレンドを確認して問題を早期に検出します。
あらゆる段階での人間の専門知識の活用
ポリシーを策定し、AIを訓練し、そのパフォーマンスをモニタリングするのは人間です。そして、最も繊細で複雑かつ影響の大きい決定を下します。AIは大規模なコンテンツ施行をより適切に行い一貫性を高め、人間は判断とシステムの監督を担います。
ポリシー領域全体のパフォーマンス
MetaのAIモデルは複数のポリシー領域において初期段階のテストでも改善が見られています。
不正および詐欺
人をだましてログイン情報を聞き出す詐欺師を阻止するように設計されたあるAIソリューションは、既存の審査チームでは検出できなかった1日あたり5,000件の詐欺行為の試みを発見して未然に防止しました。
違反している成人向けコンテンツ
成人への性的行為の勧誘という違反を検出するために構築されたAIシステムは、人間による対応と比べて2倍以上の違反コンテンツを検出し、誤判定率も60%以上低減しました。これは、有害なコンテンツをより迅速に特定して削除すると同時に、誤ったコンテンツ施行からより多くの利用者を保護できていることを意味します。
なりすまし
AIにより、著名人のなりすましに関する利用者からの報告は80%減少しました。AIは名前の一致だけに頼るのではなく、プロフィールの詳細、投稿パターン、真正性の欠如を示す関連特性など、より多くの文脈を分析することで著名人のなりすましを認識できます。
今後の取り組み
この移行は段階的に進められており、各段階で慎重なテストが行われます。Metaは、コンテンツ施行に関するデータをコミュニティ規定施行レポートで公開しており、AIによるコンテンツ施行がより多くのポリシー領域に拡大する中で、成功事例と課題の両方を含め、得られた知見を引き続き共有していきます。また、Metaの規定とポリシーの適用に関する深い専門知識を持つ専門家チームを世界規模で強化していく予定です。
この移行と施行プロセスに関する透明性は重要です。現在、Metaが違反に対してどのように措置を講じているかについて、詳しくは措置の実施をご覧ください。Metaのポリシーについて、詳しくはコミュニティ規定をご覧ください。Metaは、ポリシーを進化させる中でさまざまなステークホルダーと定期的に連携しており、この移行の過程においても、規制当局、外部の専門家、監督委員会と協働しながら、そのアプローチに関する意見を引き続き求めていきます。
Metaのアプローチは、新たな脅威、変化し続けるスラング、薬物販売に用いられる隠語のような新たな課題に適応できるよう設計されています。このアプローチは、先進的なテクノロジーと人間の判断を組み合わせることで最良の結果が得られるという基本理念に基づいています。