我们如何创建和使用特定市场的诋毁词语列表

更新日期 2022年8月12日
我们如何制定特定市场的诋毁词语列表
根据我们社群守则的定义,诋毁词语是指本身具有冒犯之意,并且用于针对受保护特征侮辱他人的字词。多个政策、市场和利益相关方参与团队都参与了诋毁词语的确定。为了创建这些列表,我们的区域团队对其所在地区或社群(我们称之为市场)中的语言和文化进行了持续的定性和定量分析。这包括审核使用的词语的当地和通俗用法、相关词语在我们平台上的流行度及其相关含义。他们可能使用从新闻文章、学术研究和其他语言研究中获得的文化知识。在我们的政策和运作流程方面,区域团队得到了其他专家的协助。他们通过协助了解文化背景(通过新闻文章、学术文章等),并且必须收集和评估包含相关词语的至少 50 条内容。分析完成后,政策团队将审核当地市场提供的所有信息,以便根据相关的 Meta 政策评估内容是否合规。市场团队负责确保与之相关的诋毁词语列表尽可能详尽且更新及时。
另外,我们还会分析某些字词在我们平台上的使用方式,以判断这些字词有多符合我们对诋毁词语的定义。例如,我们平台上某些字词的使用可能涉及到先前未被发现的诋毁词语变体或者应当引起注意的相关表述。我们会分析平台上诋毁词语的使用情况,以此来识别这些问题。此外,诋毁词语列表和政策中还说明了,在哪些情况下能以允许的方式使用特定的诋毁词语,例如,明确出于自述的目的使用、使用时表达的是其他含义、围绕诋毁词语的使用开展讨论、报道诋毁词语相关内容、谴责诋毁词语的使用,或者以明显积极的方式使用诋毁词语。
我们如何实施特定市场的诋毁词语列表
不同的国家和文化可能使用同一种语言,但有些词语往往只针对特定地区或社群(我们称之为市场)才有诋毁之意。正因如此,我们才使用按市场划分(而非仅仅以语言划分)的诋毁词语列表。针对各类违规,我们在多个地区安排了多种语言(争取覆盖所有方言)的审核员。我们会根据这些审核员所掌握的语言技能及擅长处理的违规类型来给他们分配任务,这样审核员们便更加清楚哪些诋毁词语列表与他们各自要审核的内容最为相关。我们的内容审核流程在综合考虑语言和地区的基础上,为内容指派合适的审核员,不过通常而言,面对较复杂的内容审核,我们会更多地考虑语言因素。例如,南椎体 (Southern Cone) 市场的内容审核队列中包含了来自智利、乌拉圭、阿根廷和巴拉圭的内容,这些内容主要为西班牙语。此外,各个市场的队列算法都设置了一个名为“catch all”(全部捕获)的条件。通过这一条件,如果某个市场的一些内容使用了一种该市场中所有国家/地区都没有指定的语言,则这些内容都将自动归入与此语言最为相关的市场。举个例子,对于用户在南椎体市场(例如阿根廷)境内发布的法语内容,其审核任务将归入法国市场的审核队列中,诸如此类。当一段以某种语言制作的内容中出现其他语言的诋毁词语时,我们的批量审核技术会醒目提示,该词已列入其他市场的诋毁词语列表中,进而在该市场的所有审核内容队列中将之批量标记为涉嫌违规的表达。
队列算法会综合考虑语言和国家/地区,因为诋毁词语可能有着与时事动态及市场背景相关的说明作用(或者其他积极用法)。在审核员判断某个字词是否允许出现时,市场背景是一个重要的考虑因素。如果缺乏背景信息,而且没有其他任何相关允许用途的既往案例,则我们偏向于将内容判为违规。
我们如何审核和更新特定市场的诋毁词语列表
我们对诋毁词语列表进行年度审核。这项工作由我们的运营团队和区域市场团队合作完成,两者共同审核诋毁词语并得出结论,确定相关词语是否具有最初将其列入诋毁词语列表所具备的冒犯性特征。我们还鼓励区域团队(包括批量审核合作伙伴)继续关注其所在市场的语言发展动向,并据此提出应该增加到其所在市场的列表中的新诋毁词语,或提议修改列表中的现有词语。最后,我们还向合作的民间团体和非政府组织征求意见,了解他们对哪些词语应被视为诋毁词语有何看法。