透過 AI 轉換內容政策執行方式

上次更新日期 2026年3月19日
一直以來,我們都是搭配使用技術和真人,雙管齊下審查內容和執行《社群守則》。如近期公告所言,我們正在實驗將更先進的 AI 系統納入現有內容政策執行程序。為減少失誤狀況,我們在去年改變作法後獲得正面成果,並計劃繼續朝這方面努力,如今新版系統能偵測到更多嚴重違規內容和非法內容、遏止更多詐騙行徑,並更快對現實世界事件祭出因應措施。
然而,即使我們採取更多新技術來擴展可能性,真人仍會在我們的作法中佔據核心地位。我們的專家仍會負責撰寫和制定政策;設計、訓練和評估我們的 AI 系統;衡量成效;而且仍會做出最複雜、影響深遠的決定。這是我們持續精進下的結果,結合先進 AI 的規模和強大功能,以及真人的專業知識與判斷力,兩者相輔相成,為了確保用戶享有安全的平台體驗而努力。
異動和維持不變之處
分階段謹慎上路
我們會逐步謹慎推行本次轉換程序,以充足的準備確保措施均經過深思熟慮才實際執行。部署前,每個 AI 模型都會經過多階段嚴格測試。唯有技術在我們所有測試中的表現持續優於現有系統時,我們才會轉換成以 AI 優先的方式執行政策。
新異動:涵蓋更多語言且偵測功能更完善
這些更先進的 AI 系統涵蓋 98% 網路用戶所使用的語言,遠超過我們之前約 80 種語言的涵蓋範圍,可協助我們更準確且一致地對數十億則內容執行政策。這些系統也能瞭解更多背景資訊和文化中的微小差異(包括小眾的次文化)、日新月異且地區特有的暗語、表情符號意義和俚語。
初期測試已發現這些細微差異,對於後續政策執行似乎前景可期,例如我們的 AI 系統偵測到假冒合法網址的假網站,該網站使用真實標誌,但售價低得出乎尋常,加上網址相當可疑,進而發現該網站試圖假冒熱門的運動用品店。
不變之處:政策執行的核心原則
  • 以真人為核心:在內容政策執行實務中,真人仍然扮演核心角色。專家團隊是 Meta AI 政策執行的建構者;他們訂定政策、訓練模型、驗證成效,以及處理高風險、高影響力的決策,例如對帳號停用申訴做出最終決定,以及依法律規定通知執法機關。
  • 社群守則:此次變更中,《社群守則》沒有任何異動,對於平台允許和禁止哪些內容,該守則仍是我們的評判根據。唯一改變的是我們執行這些政策的方式。
  • 檢舉和申訴:您仍可以檢舉您認為違反我們政策的內容。此外,若我們對您的內容或帳號採取處置,您仍可針對處置方式提出申訴。
運作方式
我們的作法是在整個過程中,將 AI 功能與人類的專業知識相互整合。
部署前嚴格測試
任何 AI 系統在做出實際處置決策前,我們都會先執行嚴格測試,並設置安全防護。我們會將 AI 和我們經驗最豐富的審查人員相互比較,檢視兩者的決策品質,唯有成效穩定優於現有的內容政策執行方法,才會正式部署。
明確的品質標準
每個模型都必須達到特定的準確率標準,才會部署上線。我們會審慎評估成效,確保決策一致、有效、公平、準確,進而確認能正確辨識真正的違規內容,以及區分違規和未違規的內容。
持續監控
部署後,我們會持續評估每個模型。我們會追蹤準確率,觀察是否發生意想不到的變化;如果出現問題,我們可以快速調整或改善模型。我們的系統能迅速反覆調整和修正,團隊和技術都會密切觀察趨勢,以便及早發現問題。
每個階段涉及的人類專業
政策由真人設計,AI 由真人訓練,運作成效由真人監控。最細微、複雜、高風險的決定,也是由真人完成。AI 較擅長大規模執行政策,提高一致性;人類則可自主判斷和監督系統運作。
政策執行成效
即使在初期階段測試,我們的 AI 模型在以下幾項政策方面皆已有所改善:
詐欺和詐騙
有項AI 解決方案是專門為了防止詐騙分子誘騙用戶洩露登入詳細資料而設計,每天可找到並阻止 5,000 次詐騙意圖,而這些行徑都是現有審查團隊從未發現的活動。
違規成人內容
我們也打造 AI 專門偵測違規的成人性誘惑內容,該 AI 找到的違規內容比真人多出兩倍以上,同時錯誤率也減少超過 60%。也就是說,我們能更快找到並移除有害內容,同時保護更多用戶不受政策執行錯誤所影響。
身分假冒
用戶對假冒名人的帳號提出檢舉,在 AI 的輔助下,檢舉數量減少了 80%。AI 不僅可以比對姓名,還可以分析更多背景資訊(例如個人檔案詳細資料、發文模式,以及足以確認帳號非本人的相關特徵),辨識某人是否假冒公眾人物。
未來展望
此轉換過程會分階段進行,且每個階段都會仔細測試。隨著 AI 執行範圍擴大到更多政策,我們會在《社群守則執行狀況報告》中公佈執行資料,也會持續分享我們的學習成果(包括成功案例和挑戰)。我們也計畫在 Meta 內部加強訓練全球專業團隊,協助他們深入瞭解如何執行我們的守則和政策。
公開透明地說明這次轉換和政策執行程序相當重要。若要深入瞭解我們目前對違規內容採取的處置方式,請參閱採取行動。若需查看我們政策的相關詳細資訊,請參閱《社群守則》。我們會在政策制定過程中定期與各種利害關係人交流聯繫,在轉換期內也會繼續與監管機構、外部專家和監察委員會攜手合作,徵求各界對我們所採作法的意見回饋。
我們的作法經過精心規劃,能適應新威脅、不斷演變的俚語和新興挑戰,例如販毒暗語。此外也結合先進技術和真人判斷,以獲得最佳成果為原則持續精進。