Comment nous créons et utilisons des listes d’insultes en fonction des marchés
MIS À JOUR 12 AOûT 2022
Comment nous développons des listes d’insultes en fonction des marchés
Les injures sont définies dans nos Standards de la communauté comme des mots intrinsèquement offensants ou utilisés pour insulter des personnes à cause de caractéristiques protégées. Différentes équipes, et notamment celles chargées des règlements, des marchés et des interactions avec les parties prenantes, participent à l’identification des insultes. Pour créer ces listes, nos équipes régionales mènent à bien des analyses qualitatives et quantitatives de la langue et de la culture de leur région ou communauté (que nous désignons sous le nom de « marché »). Cela implique d’examiner la manière dont un mot est utilisé localement et familièrement, la fréquence à laquelle il apparaît sur nos plateformes et le sens qui lui est attribué lorsqu’il est utilisé. Il est possible d’utiliser des connaissances de la culture basées sur des articles d’actualité, des études universitaires et autres études linguistiques. Nos équipes régionales reçoivent l’aide d’autres spécialistes de nos règlements et de nos processus opérationnels. Du contexte culturel est fourni (articles d’actualité, articles universitaires, etc.), et au moins 50 contenus mentionnant le terme en question doivent être recueillis et évalués. À l’issue de cette analyse, les équipes chargées des règlements examinent toutes les contributions des marchés locaux, de manière à évaluer le contenu à la lumière du règlement Meta qui s’y applique. Les équipes de marché sont tenues de veiller à ce que leurs listes d’insultes pertinentes soient les plus exhaustives et à jour possible.
Nous analysons également la manière dont certains mots sont utilisés sur nos plateformes afin de déterminer dans quelle mesure ils correspondent à notre définition d’insulte. Par exemple, l’utilisation de certains mots sur nos plateformes peut indiquer des insultes incluant des variations jusqu’alors non identifiées ou des termes liés qui devraient être pris en compte. Nous analyserons l’utilisation d’insultes sur nos plateformes pour détecter ces cas de figure. De plus, les listes et règlements relatifs aux insultes orientent sur les circonstances dans lesquelles une insulte donnée peut être utilisée de manière autorisée, par exemple lorsqu’une personne l’utilise pour se référer à elle-même, ou en lui conférant un autre sens, ou encore dans le cadre d’une discussion sur l’utilisation des insultes, d’un signalement d’insulte, d’une condamnation de leur utilisation ou d’une utilisation explicitement positive.
Comment nous appliquons des listes d’insultes en fonction des marchés
Si les langues peuvent être partagées par plusieurs nations et culture, les insultes sont souvent spécifiques à une région ou communauté (que nous désignons sous le nom de « marché »). C’est pourquoi nous utilisons des listes d’insultes en fonction des marchés, pas seulement des langues. Parmi toutes les catégories d’infraction, nous disposons d’équipes de révision qui couvrent différentes régions en plusieurs langues (pour couvrir tous les dialectes dans la mesure du possible). Des files d’attente sont attribuées à ces équipes de révision en fonction de leur langue de spécialité et du type d’infraction dans lequel ils sont spécialisés. Ils ont ainsi une meilleure idée des listes d’insultes les plus pertinentes pour leurs files d’attente de contenu respectives. Notre processus de distribution du contenu à modérer inclut à la fois la langue et la région afin d’identifier les bonnes équipes de révision pour chaque contenu, mais généralement, c’est la langue qui joue le plus grand rôle. Par exemple, les files d’attente du marché Cône Sud incluent du contenu provenant du Chili, de l’Uruguay, de l’Argentine et du Paraguay, avec l’espagnol comme langue principale. L’algorithme de file d’attente de chaque marché possède aussi une condition « catch all » pour ne rien laisser passer. Cette condition permet à toutes les tâches dans une langue non attribuée aux pays couverts par leur marché d’être automatiquement transmises aux marchés les plus pertinents pour cette langue. Ainsi, les tâches en français provenant géographiquement du marché Cône Sud (par exemple l’Argentine) seraient transmises aux files d’attente d’examen des marchés français, et vice-versa. Face à une insulte dans une langue différente du reste du contenu, notre technologie d’examen évolutive indique qu’elle apparaît sur la liste d’insultes d’un marché différent, afin de la signaler à grande échelle et dans les files d’attente de tous les marchés en tant qu’éventuelle infraction linguistique.
Les algorithmes de file d’attente tiennent à la fois compte de la langue et du pays, parce que les insultes peuvent comporter des avertissements (ou des cas d’utilisation alternative anodins) en lien avec ce qui se passe dans le monde à chaque moment et dans le contexte du marché. Le contexte du marché est important pour que les équipes de révision déterminent si un mot s’inscrit ou non dans un cas d’utilisation admissible. Faute de contexte, et en l’absence de tout autre cas d’utilisation admissible, nous avons tendance à considérer que le contenu est en infraction.
Comment nous vérifions et mettons à jour les listes d’insultes en fonction des marchés
Nous soumettons nos listes d’insultes à une vérification annuelle. Elle est exécutée par des équipes opérationnelles en collaboration avec nos équipes des marchés régionaux, qui examinent ensemble les insultes et parviennent à déterminer si le mot présente le caractère offensant qui avait motivé son inclusion dans la liste. Nous encourageons également nos équipes régionales, et notamment nos partenaires d’examen à grande échelle, à surveiller en permanence l’évolution linguistique de leur marché et à proposer en conséquence de nouvelles insultes qui devraient être ajoutées à la liste ou à suggérer la vérification de mots de la liste existants. Enfin, nous demandons aux groupes de la société civile et des organisations non gouvernementales avec lesquelles nous travaillons de nous indiquer quels mots devraient être considérés comme des insultes.