運用 AI 轉變內容政策執行方式
上次更新日期 2026年3月19日
我們一直以來都是透過技術和人工來審查內容並執行《社群守則》。正如我們最近公告,我們正在試驗將更先進的 AI 系統整合到現有的內容政策執行流程中。我們的目標是保留去年為減少錯誤而作出的變更所帶來的正面成果,同時更新我們的系統,使其能夠找出更嚴重的內容違規行為和非法內容、阻止更多詐騙行為,以及更快速地應對現實世界的事件。
然而,即使我們採用更多新技術來擴大可能性,人始終是我們方針的核心所在。我們的專家仍負責訂立和制定我們的政策、設計、訓練和評估我們的 AI 系統、衡量成效,並且仍會作出最為複雜和影響重大的決定。這是對我們如何結合進階 AI 的規模和功能與人類的專業知識和判斷能力的演變,兩者相輔相成,從而確保用戶在我們的平台上安全無虞。
有所變動和維持不變的項目
分階段且小心謹慎地推出
我們會逐步且謹慎地進行這次過渡,花時間確保我們的推出計劃經過周詳考慮。每個 AI 模型在部署前都會經過嚴格的多階段測試。只有當這類技術在我們所有的測試中持續表現優於現有系統時,我們才會切換至以 AI 為主的政策執行方式。
最新消息:更多支援語言和更出色的偵測功能
這些更先進的 AI 系統涵蓋 98% 網上用戶所用的語言,遠超過我們之前涵蓋的約 80 種語言,讓我們能夠更準確和一致地對數十億項內容執行政策。這些系統亦能理解更多的背景和文化細微差別,包括小眾次文化、快速變化的地區專屬代號、表情符號含義和俚語。
早期測試已顯示,AI 在執行政策時能夠找出這些細微差異,例如我們的 AI 系統能夠透過注意真實商標被用於售價異常低價的商品和可疑網址,來偵測假冒正當網址的虛假網站,並冒充熱門體育用品店。
相同之處:政策執行的核心原則
- 以人為本:人仍然是內容政策執行方法的核心。專家團隊是 Meta AI 政策執行的設計師;他們負責訂立政策、訓練模型、驗證成效,以及處理高風險和高影響力的決定,例如就帳戶停用申訴作出最終決定,以及在法律有所要求時通知執法機關。
- 《社群守則》:《社群守則》不會因這次的轉變而改變,而且將繼續定義我們的各項規則,說明我們的平台上允許和不允許出現的內容。唯一改變的是我們執行這些政策的方式。
- 舉報和申訴:您仍可舉報您認為違反我們政策的內容。如果我們對您的內容或帳戶採取行動,您仍可針對該處置提出申訴。
運作方式
我們的做法是在整個過程中結合 AI 功能和人類的專業知識。
部署前經過嚴格測試
任何 AI 系統在作出實際的政策執行決定前,我們都會先嚴格測試該系統並設立安全防護機制。我們會比較該技術的決定與我們最資深審查人員的決定,並且只會在確認該技術持續表現比我們目前的內容政策執行方法更好時,才會部署該技術。
訂立明確的品質標準
每個模型在部署前都必須達到特定的準確度基準。我們評估成效以確保一致性、有效性、公平性和準確性 — 確保我們正確識別實際違規情形,並區分違規情形和非違規內容。
持續監察
每個模型在部署後都會持續接受評估。我們會追蹤準確度、監察成效是否有意外變化,並且在出現問題時迅速調整或微調模型。我們的系統經過精心設計,能夠快速持續提升和修正成效,而我們的團隊和技術則會審視各種趨勢,儘早找出問題。
人類專業知識滲透每個階段
我們是以人為本地設計各項政策、訓練 AI、監察成效,也以手負責處理最為複雜、最為微妙且最為關鍵的決策。AI 可以更有效地大規模執行政策和提高一致性;真人則可提供判斷和監督系統。
各個政策領域的表現
即使是在早期測試階段,我們的 AI 模型在多個政策領域都已經有所改進:
欺詐和詐騙
我們推出了一個 AI 解決方案,旨在阻止詐騙份子誘騙用戶透露自己的登入詳細資料。這個解決方案每天成功找出並阻止 5,000 次詐騙嘗試,而這些詐騙嘗試均是現有審查團隊之前未能發現。
違規的成人內容
我們為了偵測違規的成人性誘惑內容而開發的 AI 系統,除了比人類能夠找出多兩倍的違規內容,還將錯誤率降低了超過 60%。換言之,我們現在能更快地找出並移除有害內容,同時保護更多用戶免受政策執行處置失當的影響。
假冒
AI 將用戶針對知名人物假冒行為提出的舉報數量減少了 80%。除了配對名稱以外,AI 還可以分析更多背景資料,例如個人檔案詳情、發佈帖子的模式和涉及不真實的相關特徵,以此識別冒充公眾人物的用戶。
展望未來
我們將分階段進行這次過渡程序,並在每個階段仔細測試。我們在《社群守則執行狀況報告》中發佈政策執行資料,並會隨著 AI 政策執行措施擴大到更多政策領域,繼續分享我們的經驗之談,包括成功和挑戰之處。我們也計劃在 Meta 全球專門團隊中,增加具備深厚專業知識的人員,讓他們負責執行我們的守則和政策。
有鑑於此次過渡期和政策執行程序的重要性,我們必須確保過程透明。若要進一步了解我們目前如何處置違規內容,請參閱「採取行動」。如需有關我們政策的詳細資訊,請參閱我們的《社群守則》。隨著我們不斷改善政策,我們也會定期與各種利害關係人交流,而在這次過渡期中,我們將會持續與監管機構、外部專家和監察委員會合作,藉此徵求對我們方針的意見。
我們制定這個方針的目的,就是為了適應新威脅、不斷演變的俚語,以及藥物銷售的隱語等新興挑戰。這項技術秉持的原則是透過結合先進的技術與人類的判斷能力,就能夠創造出最理想的成果。