テクノロジーへのMetaの取り組み
更新日 2022/01/19
弊社のツールがコンテンツの内容をより正確に理解できるようにするために弊社が実施したAIテクノロジーへの取り組みには次のようなものがあります。
- 世界中のさまざまな地域からFacebookとInstagramに掲載されるコンテンツを分析する新しいアーキテクチャ「Linformer」を開発。
- オンラインでのシグナルから学習してヘイトスピーチの検出機能を向上させる新しいシステム「強化型統合最適化ツール」を構築。
- コンテンツの内容の微妙な違いを検出し、偽情報の対策に役立つ画像一致ツール「SimSearchNet」を改良。
- 多言語で同一の概念を理解できる分類機能を構築するのに役立つ、言語ツール「XLM」および「XLM-R」を導入。これにより、テクノロジーに1つの言語で学習させることができれば他の言語でもパフォーマンスを向上させることができるようになります。そのため、インターネット上であまり一般的でない言語を処理する際に特に役立ちます。
- コンテンツにヘイトスピーチが含まれているかどうかを判断するのに役立つコンテンツ分析機能を備えた、エンティティ全体を理解するシステムを構築。
オープンな連携の実現に向けAI業界を牽引
有害なコンテンツの脅威はテクノロジー業界だけでなく一般社会にも広く影響を及ぼします。そのためFacebookでは自社のテクノロジーをオープンソース化して、他の組織の関係者が利用できるようにしています。AIコミュニティとオープンに連携することで、研究・開発を加速させ、有害なコンテンツの検出と防止に役立つ新たな方法を生み出し、人々の安全を維持できると弊社は信じています。
近年Facebookがオープンソース化したテクノロジーの一部を以下にご紹介します。これらには弊社が設立を促した2つの業界コンテストも含まれています。
XLM-R
XLM-Rは1つの言語で訓練することで、追加の訓練データなしで他の言語でも利用できる機械学習モデルです。Metaのテクノロジーでは160種類以上に及ぶ言語でコンテンツが投稿されていますが、XLM-Rによってこうした膨大な種類の言語に1つのモデルで対応できるようになり、言語ごとに個別のモデルを構築する必要がなくなります。そのため、さまざまな言語によるヘイトスピーチやその他の違反コンテンツを特定したり、製品の運用を多言語で一斉に開始したりすることがこれまでになく容易になります。Metaでは自社のモデルとコードをオープンソース化して、リサーチコミュニティが取り組んでいる各種の多言語モデルのパフォーマンス向上に貢献しています。
目標: 利用する言語に関係なくすべての人に、Facebookの各種プラットフォームで最高のエクスペリエンスを楽しんでもらう。Linformer
Linformerは、世界中のさまざまな地域からFacebookとInstagramに掲載される数十億件のコンテンツを分析するトランスフォーマーアーキテクチャです。Linformerはヘイトスピーチを含むコンテンツと暴力を助長するようなコンテンツの検出に役立ちます。弊社は自社の研究を公開し、Linformerのコードをオープンソース化して、他の研究者・エンジニアたちが取り組んでいるモデルの改良に貢献しています。
目標: テキストや画像、スピーチから学習する新たなAIモデルを作成し、ヘイトスピーチ、人身売買、いじめ、その他の有害なコンテンツを効率的に検出する。Deepfakes Detection Challenge
弊社は、視聴者を欺く目的でAIを使って操作した動画を検出するテクノロジーの向上に向け、Microsoft社、AI関連パートナー、複数の大学の学術機関と連携してコンテストを設立しました。弊社はDeepfakes Detection Challengeへの貢献として、現在業界において不足している、ディープフェイクの検出に有用な現実的データセットのテストを実施しました。
目標: 人々を欺く目的でAIを使って操作したメディアを検出・防止するための新たな方法の創出に向け業界に拍車をかける。Hateful Memes Challenge
Facebookは、画像とテキストの組み合わせを使用したヘイトスピーチの検出における課題を克服するための研究を加速させるため、Getty ImagesとDrivenDataと連携してコンテストを設立しました。Hateful Memes Challengeでは、研究者の作業に役立ててもらうため10,000件を超えるユニークなデータセットを作成しました。
目標: マルチモデルのヘイトスピーチを検出するための新しいアプローチや方法の創出に向け業界に拍車をかける。