修正和调整
更新日期 2024年10月2日
本报告将详细说明我们通过信息质量核查流程发现的所有具体调整。此外,我们将根据统计流程的结果相应地更新本报告。
2024 年 8 月:修复了 Facebook 虚假账户传播度统计系统中的漏洞
我们发现并修复了 2024 年第一季度用于计算 Facebook 虚假账户传播度的查询语句存在漏洞。因此,2024 年第一季度的虚假账户传播度数据存在轻微高估。
2024 年 5 月:修复了统计 Facebook 和 Instagram 传播度所用采样方法的漏洞
违规内容的传播度通过对 Facebook 或 Instagram 上的内容浏览次数进行抽样估算得出。我们修复了一个会抽取少量不相关数据的漏洞,该问题现已解决且未对传播度的统计造成显著影响。
2023 年 11 月:更新了 Facebook 和 Instagram 上主动检出率的统计方法;网络钓鱼内容不再归入垃圾信息类别
更新统计方法后,多项违规类型的主动检出率均有所上升。此前,当某篇帖子被用户举报时,我们会将帖子收到的评论也视为被举报对象。从 2023 年第三季度起,我们调整了统计方法,仅当用户直接举报评论时,我们才会将相应的评论视为被举报对象。
此外,为与先前的 Meta 政策变更保持一致,自 2023 年第三季度起,网络钓鱼指标不再计入社群守则执行情况报告中的垃圾信息部分。
2023 年 8 月:更新了 Facebook 和 Instagram 虚假账户的统计方法
根据欧盟《数字服务法》(Digital Services Act,简称“DSA”)的规定,在我们执行处理措施后,应为用户留出 6 个月的申诉时间,因此我们延长了申诉时间窗。这意味着,为了在我们的虚假账户指标中有效体现这一用户体验,我们已相应调整虚假账户的统计方法,以便与上述对时间窗的新要求保持一致。我们在第一季度与第二季度间观察到的虚假账户移除量增长,正是源于此次统计方法的调整。
2023 年 2 月:更新了 Facebook 和 Instagram 上主动检出率的统计方法
我们致力于持续优化和改进本报告分享的指标,其中一项举措是:从 2022 年第四季度起,我们更新了主动检出率的统计方法,仅当违规内容在用户举报之前由我们主动检测出并处理时,才会将相应的处理行为计入“主动检出”的范畴。原有统计方法在存在双重检测情形(即内容既被我们主动检测出,又收到用户举报)时,只要主动检测发生时间更早,相关处理行为便会被计入“主动检出”的范畴。新统计方法将用户举报行为纳入考量,此类情形现均归类为“被动检出”而非“主动检出”。此次调整未对指标数据产生重大影响,仅引起主动检出率指标出现轻微的季度环比变动。本文档中的表格展示了 2022 年第三、四季度报告期内,采用新旧两种统计方法所得指标的对比数据。
2022 年 8 月:更新了 Facebook 和 Instagram 上申诉内容的统计方法
从 2020 年第一季度起,因新冠疫情导致我们的审核处理能力临时下降,我们无法在任意情况下均为用户提供申诉选项,但仍为用户提供就我们的决定表达异议的选项。正如 2020 年第一季度至 2022 年第一季度期间的数据所示,此类异议反馈并未计入申诉指标的统计范畴,原因是:虽然其提供了宝贵的用户反馈,但因未获得审核机会而不能被视作申诉。过去一年间,我们持续改进和完善相应的申诉体验,随着运营常态化,现已对多数此类反馈启动审核流程。
我们致力于持续优化和改进本报告分享的指标,其中一项举措是:从 2022 年第二季度起,我们更新了申诉的统计方法,将用户提请复审的所有内容实例均纳入统计,包括用户就我们的决定表达异议的情形。我们仍将排除用户未提请复审的内容实例,即使用户已就我们的决定向我们表达异议,例如很多垃圾信息案例就属于此列。
2022 年 2 月:Facebook 和 Instagram 上恐怖主义内容的内容处理量、内容申诉量、主动检出率和内容恢复量。
第四季度,我们整理了 Facebook 和 Instagram 上被处理的恐怖主义内容,并对其进行了重新分类。此次调整影响了我们先前公布的 2021 年第三季度的内容处理量、主动检出率、内容申诉量和内容恢复量数据,相关数值现已修正。
2021 年 11 月:Instagram 上被处理的自杀和自残内容,以及 Facebook 上恢复的儿童裸露和性剥削内容。
2020 年第二季度,我们部分原本按暴力和血腥内容政策处理的内容,经后续复核实则应归类于自杀与自残专项政策的违规范畴。我们相应地对这部分内容进行了重新分类,此次调整影响了先前公布的 2020 年第二季度 Instagram 上的内容处理量数据。此外,由于前期存在分类错误,我们对 2020 年第三季度 Instagram 上儿童裸露和性剥削内容的恢复数量进行了微调。我们将持续更新历史数据,以反映政策调整、系统优化及数据核算方法的改进。
2021 年 8 月:垃圾信息、自杀和自残内容的处理量;欺凌和骚扰以及自杀和自残内容的主动检出率;成人裸露和性行为内容的恢复量
本季度我们对垃圾信息、自杀和自残内容的指标进行了精度优化,此次调整使得与先前报告的数据相比出现微小变化。我们还调整了统计方法,这使得欺凌和骚扰以及自杀和自残内容的主动检出率出现小幅变化。最后,我们对之前根据垃圾信息规定处理的部分内容进行了重新分类,将其归入成人裸露和性行为内容类别,此次调整影响了内容恢复量指标。
2021 年 5 月:Facebook 上被处理的自杀和自残内容
2020 年,我们部分原按暴力血腥内容政策处理的内容,经复核实则应归类于自杀自残违规范畴。我们相应地对这部分内容进行了重新分类,此次调整影响了先前公布的 2020 年 Facebook 上的内容处理量数据。
2021 年 2 月:Facebook 上因违反成人裸露和性行为内容相关规定被处理而后恢复的内容;Facebook 上暴力和血腥内容的传播度和内容处理量;Facebook 上因违反自杀和自残内容相关规定被处理的内容;以及 Instagram 上的内容恢复量
第四季度,我们针对 Facebook 上成人裸露和性行为政策中的部分图片类别发布了分类细则。我们依据最新政策恢复了部分之前被处理的内容,此次调整影响了先前公布的第三季度 Facebook 上的内容恢复量数据。
关于 Facebook 暴力和血腥内容的传播度,2020 年 11 月社群守则执行情况报告原公布的数据为浏览量的 0.05%–0.06%。在 2021 年 2 月期报告中,我们将第三季度的暴力和血腥内容传播度更新为约浏览量的 0.07%。
第二季度,在我们以违反政策中有关暴力和血腥内容的规定为由而处理的内容中,部分内容在 9 月初我们恢复部分人工审核能力后,被发现违反的是政策中有关自杀和自残内容的规定。我们相应地对这部分内容进行了重新分类,此次调整影响了先前公布的第三季度 Facebook 上的内容处理量数据。
此外,我们调整了第一季度和第二季度 Instagram 上的内容恢复量,纳入了此前已恢复但未报告的评论内容。此项调整对 Instagram 上大多数政策领域的统计数据产生了轻微影响,我们已对先前公布的数据作出相应修正。我们将持续更新历史数据,以反映政策调整、系统优化及数据核算方法的改进。2020 年 11 月:更新了 Facebook 和 Instagram 上的内容处理量、主动检出率、用户提出申诉的内容量及内容恢复量的调整数据
第三季度,我们更新了分类标准,将先前被视为残忍和冷漠内容而处理的内容重新归类,不再将其界定为仇恨言论。此次更新影响了我们先前公布的 2019 年第四季度、2020 年第一季度和 2020 年第二季度的内容处理量、主动检出率、内容申诉量和内容恢复量数据,我们已对这些数值作出相应修正。同时,我们还更新了政策,扩大了对血腥自杀和自残内容的移除范围,并将第二季度原本标记为“令人不适”的部分暴力和血腥内容进行了重新分类。
此外,我们调整了第一季度和第二季度 Instagram 上的内容恢复量数据,既为纳入之前已恢复但未报告的评论内容,也因修复了 2020 年 8 月期报告中存在的数据源问题。此项调整对 Facebook 和 Instagram 上大多数政策领域的统计数据产生了轻微影响,我们已对先前公布的数据作出相应修正。未来,随着政策发生变更及我们所用系统与统计方式的持续优化,我们将继续对历史数据进行相应修正。2020 年 8 月:Instagram 上被处理的暴力和血腥内容
2020 年第一季度,我们发现并修正了 Instagram 上暴力和血腥内容主动检测技术处理数据的统计偏差问题,并于第二季度完成了全部报告系统的数据更新。对于 Instagram 上的暴力和血腥内容,2020 年第一季度的内容处理量在 2020 年 5 月期报告中原公布为 230 万条,而后在 2020 年 8 月期报告中更新为 280 万条。
2020 年 5 月:更新了 Facebook 和 Instagram 上的内容处理量、主动内容处理量、用户提出申诉的内容量及内容恢复量的调整数据
在 2019 年 11 月的最新一次更新中,我们对所使用的系统和统计方式推出了多项改进升级。这些改进措施使我们能够在持续调整指标的同时,预估其可能带来的最大影响。在 2019 年 11 月期报告发布后,我们进一步完善了这些改进措施。
基于此次改进措施,我们在第五版 2020 年 5 月期社群守则执行情况报告中修正了先前公布的数据。2019 年大多数政策类别的统计数据仅受到轻微影响,各项数据调整对内容处理量产生的变化幅度均不超过 3%。我们将持续依据现行及更新的协议,对之前因不同违规原因被移除的内容进行重新分类,并不断完善系统与统计核算方法,据此持续更新历史数据。2019 年 11 月:Facebook 上垃圾信息的内容处理量和主动检出率
Meta 为各类型内容使用了不同的处理系统,力求提高每个季度数十亿次内容处理工作的效率和可靠性。其中一个主要负责处理含链接内容的系统存在记录漏洞:若内容创建后 7 天内无人尝试浏览,即使该内容已从平台上移除,系统仍不会记录相关的处理行为。
我们深知当前统计低估了含外部链接内容的真实数量(主要影响恶意链接内容的垃圾信息指标),但目前无法对这一低估程度进行追溯评估。因此,社群守则执行情况报告中当前公布的数据,仅代表受影响期间内容处理量和主动检出率的最低估值。未来如有相关的最新进展,我们会及时在本报告中予以公布。2019 年 11 月:Facebook 上的内容处理量、主动内容处理量、用户提出申诉的内容量以及内容恢复量
我们在发布第二版 2018 年 11 月期社群守则执行情况报告时,曾更新了内容处理的统计方式。此次更新旨在确保数据指标能更准确地反映我们在 Facebook 上以违反社群守则为由处理内容的实际情况。例如,当我们发现有一篇含有单张照片的帖子违反政策时,我们希望指标能反映我们对单条内容的处理操作,而非分别统计移除照片和移除帖子的两次操作。
然而,2019 年 7 月,我们发现负责记录和统计这些处理操作的系统并未正确记录我们的操作。究其原因,主要是因为系统需要统计在短短几毫秒内发生的多个处理操作,既要避免遗漏任何独立操作,也不能重复统计单个操作。我们的衡量日志系统独立于政策执行系统,因此本次统计核算问题仅影响采取处理行动的统计方式,既未改变政策执行标准,也未影响用户通知机制。发现该问题后,我们立即着手修复系统,核查先前公布的任何错误指标,并在流程中建立起一套更可靠的核查机制,确保统计数据准确无误。经全面核查,我们发现受此问题影响的数据包括:先前公布的 2018 年第三季度、2018 年第四季度和 2019 年第一季度的内容处理量、主动检出率、内容申诉量和内容恢复量数据。
第四版社群守则执行情况报告公布的是受影响季度的修正后指标,上文链接的表格提供了历史报告数据及其更正后的数据。