检测仇恨言论面临的挑战
更新日期 2022年1月19日
仇恨言论尤其难以通过技术和人工审核团队检测出来。不同文化、语言和地区之间的习语和差异大相径庭。此外,用户有时也会分享通常被视为仇恨言论的内容,但他们这样做是为了提高对这个问题的认识,或者是为了自嘲。
这些仅仅是检测文字中的仇恨言论所面临的挑战。我们在 Facebook 和 Instagram 上发现的仇恨言论大都是照片或视频。例如,用户可能会在表情包中同时使用文字和图片来攻击特定人群。这使我们的技术面临着更大的挑战。
如果用户试图更改内容来躲避检测,此类内容会变得更加复杂。比如说,他们可能会故意拼写错误、避开特定字眼或修改图片和视频。
使用人工智能检测仇恨言论取得的进展
在过去的几年里,我们改进了用于检测仇恨言论的工具,因此,现在我们得以在用户举报之前移除大部分此类内容,在某些情况下,我们甚至能赶在内容被任何人看见之前检出。
我们利用人工智能技术来识别与我们已经移除的仇恨言论内容相同的图片和文字。我们的技术还会审核心情和评论,以评估内容与违规内容之间的相似程度。
这些方法有助我们的技术更准确地检测仇恨言论,即便含义并不明显或内容已被更改以规避检测。
阅读 Facebook 人工智能博客中的深入分析