ヘイトスピーチの検出における課題
更新日 2022/01/19
ヘイトスピーチの検出はテクノロジーにとっても人間の審査チームにとっても特に困難な作業です。慣用句やニュアンスは文化、言語、地域によって大きく異なります。また、通常ヘイトスピーチを目的としてシェアされると考えられる言葉が、問題への意識を高めるためや、その言葉の所有を再定義するために自らに対して使われる状況もあります。
これらはあくまでもテキスト形式のヘイトスピーチの検出における課題に過ぎません。FacebookやInstagramでは写真や動画を使用するヘイトスピーチも多く見つかっています。例えば、ある特定のグループの人々を中傷するために、テキストと画像を組み合わせたミームが使われることがあります。こうした状況はテクノロジーに対してさらに大きな課題を投げかけています。
ヘイトスピーチを含むコンテンツは、コンテンツ操作により検出を逃れようとする人たちによってその複雑さが増しています。例えば、検出を逃れる手段として、意図的なスペルの誤り、特定の語句の使用の回避、画像や動画の操作などが使われています。
人工知能によるヘイトスピーチの検出への取り組みの進捗状況
過去数年にわたり、Facebookはヘイトスピーチを検出するためのツールの改良に取り組み、違反コンテンツの大半を利用者に報告される前に、一部は利用者に表示される前に、削除することに成功しています。
こうした取り組みでは、ヘイトスピーチと判断されすでに削除されているコンテンツと同じ画像やテキストを特定するためにAIを活用しています。また、Facebookのテクノロジーを利用してリアクションやコメントを検証し、違反コンテンツとの類似度も評価しています。
これらの手法は、内容の意味合いが不明瞭な場合や検出を逃れるためにコンテンツが操作されている場合でもヘイトスピーチをより正確に検出するのに役立っています。
詳しい分析については「Facebook AI」ブログをご覧ください。