利用 AI 革新内容政策执行工作

更新日期 2026年3月19日
我们始终采用技术与人工相结合的方式来审核内容和执行社群守则。正如我们近期公布,我们正尝试将更先进的 AI 系统整合进现有内容政策执行流程中。我们的目标是在去年为减少失误所做调整取得的积极成效基础上持续优化,通过升级后的系统,识别更多严重违规内容与非法内容,拦截更多诈骗行为,并对真实世界事件做出更快响应。
尽管我们运用更多新技术来拓展执行能力与覆盖范围,但人仍将是我们的方法的核心。我们的专家依旧负责制定和创建政策,设计、训练及评估 AI 系统,衡量执行成效,并继续处理最为复杂、影响重大的决策事项。这是我们工作模式的一次升级 — 将先进 AI 的规模化处理能力与专业人员的经验判断相结合,彼此互补强化,共同保障用户在我们平台上的安全。
变更和不变之处
分阶段、审慎推进落地
我们将循序渐进推进此次转型,确保落地过程周全审慎。每个 AI 模型在部署前均会经过严格的多阶段测试。只有当该技术在所有测试中表现持续优于现有系统时,我们才会转向以 AI 为主的政策执行模式。
新增亮点:覆盖语种更广,检测能力更强
这些更先进的 AI 系统覆盖了 98% 在线用户使用的语言,远超此前约 80 种语言的覆盖范围,帮助我们在数十亿内容中更精准、更统一地落实各项政策。这些系统还能理解更多语境与细微文化差异,包括小众亚文化、快速变化的地区性暗语、表情符号含义及俚语。
早期测试已在识别这类细节以开展政策执行方面展现出良好效果,例如我们的 AI 系统通过识别某仿冒网站盗用正规品牌标识、标价异常低廉且网址可疑,成功发现其伪装成知名体育用品商店的欺诈行为。
不变之处:政策执行的核心原则
  • 保持以人为本:在我们的内容政策执行方法中,人仍然发挥着关键作用。专家团队是 Meta AI 执行体系的构建者;他们负责制定政策、训练模型、验证效果,并处理高风险、高影响的决策,例如账户封禁申诉的最终裁定,以及依法向执法部门通报相关情况等。
  • 社群守则:我们的社群守则不会随此次转型发生变更,仍将作为平台内容合规与违规界定的统一准则。唯一变化的是我们执行这些政策的方式。
  • 举报和申诉:您仍可以举报您认为违反我们政策的内容。如果我们对您的内容或账户采取措施,您仍可针对该决定提出申诉。
运作方式
我们的方法是在整个流程中融合 AI 能力与人工专业判断。
部署前严格测试
任何 AI 系统在做出真实的政策执行决定前,均会经过严格测试并设置安全保障。我们会将 AI 的决定与资深审核人员的决定进行对比,仅在其表现持续优于现有内容执政策行方法时,才予以部署。
明确的质量标准
所有模型在部署前必须达到特定的精准度基准。我们通过评估表现来确保一致性、有效性、公平性和准确性 — 确保我们能正确识别实际违规内容,并区分违规内容与非违规内容。
持续监测
部署后,每个模型都会不断接受评估。我们会追踪精准度、监控表现是否存在异常变化,并且能够在出现问题时快速调整或改进模型。我们的系统会快速迭代修正,团队和技术会审核趋势,以便尽早发现问题。
全程人工参与
政策由人来设计,AI 由人来训练,表现由人来监测,而且最细微、复杂且高风险的决定由人来处理。AI 实现更优的规模化执行并提升一致性,人工则提供判断与系统监督。
各政策领域的表现
即使是在早期测试阶段,我们的 AI 模型在多个政策领域均显示出表现提升:
欺诈和诈骗
一个用于阻止诈骗分子诱导用户泄露登录信息的 AI 解决方案,每日可成功识别并拦截此前现有审核团队未能发现的 5000 次诈骗尝试。
违规成人内容
用于检测违规成人性招揽内容的 AI 系统,查处的违规内容量是人工的两倍以上,同时失误率降低超 60%。这意味着我们能更快清理有害内容,保护更多用户免于错误的政策执行。
冒充行为
AI 使知名人物冒充行为相关的用户举报量下降 80%。AI 不再仅比对姓名,还能通过分析更多信息 — 主页详情、发帖规律及体现非真实性的相关特征,识别冒充公众人物的行为。
未来展望
此次转型将分阶段推进,每一步均经过严谨测试。我们会在社群守则执行情况报告中公布执行数据,并持续分享 AI 政策执行在更多政策领域拓展过程中的经验,包括成功与挑战。我们还计划进一步强化 Meta 全球专业人员团队,这些人员在执行守则和政策方面具备深厚的专业知识。
此次转型及政策执行流程的透明度至关重要。如需详细了解当前违规处理方式,请参阅采取措施。如需详细了解我们的政策,请参阅我们的社群守则。我们会在政策优化过程中持续与各利益相关方沟通,并将在此次转型期间继续与监管机构、外部专家及监督委员会合作,征求对我们的方法的反馈。
我们的应对措施旨在适应各种情况,包括应对新威胁、不断演变的俚语以及毒品交易暗语等新兴挑战。其核心原则是:先进技术与人工判断相结合,方能实现最优效果。