Мову ворожнечі особливо важко виявити за допомогою технологій і команд із перевірки контенту людиною. Ідіоми та нюанси значно різняться залежно від культури, мови й регіону. Також люди іноді використовують слова, які зазвичай вважаються мовою ворожнечі, але роблять це, щоб привернути увагу до проблеми, або використовують їх стосовно себе, намагаючись повернути собі право на використання цього терміна.
Це виклики, пов’язані тільки з виявленням мови ворожнечі в тексті. Багато випадків мови ворожнечі, які ми знаходимо у Facebook та Instagram, містяться на світлинах або у відео. Наприклад, мем може використовувати поєднання тексту і зображення для нападок на певну групу людей. Це ще більший виклик для технологій.
Такий контент стає ще складнішим, коли люди намагаються уникнути його виявлення, змінюючи його. Наприклад, вони можуть неправильно писати слова, уникати певних фраз або змінювати свої зображення й відео.
Прогрес у використанні штучного інтелекту для виявлення мови ворожнечі
За останні кілька років ми вдосконалили наші інструменти для виявлення мови ворожнечі, тож тепер ми видаляємо більшу частину такого контенту ще до того, як користувачі поскаржаться на нього, а в деяких випадках — ще до того, як хтось його побачить.
Ми використовуємо ШІ для виявлення зображень і текстів, ідентичних контенту, який ми вже видалили як мову ворожнечі. Наші технології також аналізують реакції та коментарі, щоб оцінити ступінь схожості контенту.
Ці методи допомагають нашим технологіям точніше виявляти мову ворожнечі, навіть коли її значення не є очевидним або зміст змінено, щоб уникнути виявлення.