Đổi mới hoạt động thực thi đối với nội dung bằng AI

NGÀY CẬP NHẬT 19 THáNG 3, 2026
Chúng tôi luôn sử dụng cả công nghệ lẫn con người để xem xét nội dung và thực thi Tiêu chuẩn cộng đồng của mình. Như đã thông báo mới đây, chúng tôi đang thử nghiệm việc tích hợp các hệ thống AI tiên tiến hơn vào những quy trình thực thi hiện có đối với nội dung. Mục tiêu của chúng tôi là tiếp tục phát huy kết quả tích cực từ những thay đổi nhằm giảm bớt sai sót trong năm qua, cập nhật các hệ thống để có thể phát hiện thêm nhiều nội dung vi phạm nghiêm trọng và nội dung bất hợp pháp, ngăn chặn thêm nhiều hành vi lừa đảo, cũng như ứng phó nhanh hơn với các sự kiện ngoài đời thực.
Tuy nhiên, ngay cả khi sử dụng thêm công nghệ mới để mở rộng tiềm năng, chúng tôi vẫn sẽ chú trọng vào con người trong cách tiếp cận của mình. Các chuyên gia của chúng tôi vẫn chịu trách nhiệm viết và xây dựng chính sách; thiết kế, đào tạo và đánh giá các hệ thống AI; đo lường hiệu quả; cũng như đưa ra những quyết định phức tạp nhất và có tác động cao. Đây là quá trình phát triển cách chúng tôi kết hợp quy mô và khả năng của AI tiên tiến với chuyên môn và khả năng phán đoán của con người, trong đó mỗi yếu tố củng cố lẫn nhau, nhằm đảm bảo an toàn cho mọi người trên nền tảng của chúng tôi.
Điều gì thay đổi, điều gì không
Triển khai thận trọng theo từng giai đoạn
Chúng tôi đang tiếp cận quá trình chuyển tiếp này một cách cẩn thận theo thời gian, nhằm đảm bảo quá trình triển khai diễn ra thận trọng và chắc chắn. Mọi mô hình AI đều phải trải qua quá trình thử nghiệm nghiêm ngặt, nhiều giai đoạn trước khi được triển khai. Chỉ khi công nghệ liên tục hoạt động hiệu quả hơn hệ thống hiện có trong mọi thử nghiệm, chúng tôi mới chuyển sang quy trình thực thi ưu tiên AI.
Điểm mới: Hỗ trợ nhiều ngôn ngữ hơn và cải thiện khả năng phát hiện
Các hệ thống AI tiên tiến hơn này hỗ trợ những ngôn ngữ được 98% người dùng trên mạng nói, vượt xa phạm vi hỗ trợ khoảng 80 ngôn ngữ trước đây, để chúng tôi có thể áp dụng chính sách một cách chính xác và nhất quán hơn đối với hàng tỷ nội dung. Các hệ thống này cũng có thể hiểu thêm về bối cảnh và sắc thái văn hóa - bao gồm cả những nhóm tiểu văn hóa đặc thù - tiếng lóng, ý nghĩa của biểu tượng cảm xúc, từ ngữ ám hiệu cụ thể theo khu vực và thay đổi nhanh chóng.
Các thử nghiệm ban đầu đã cho thấy kết quả đáng khích lệ trong việc tìm ra những sắc thái này để thực thi, chẳng hạn như khi hệ thống AI của chúng tôi phát hiện trang web giả mạo địa chỉ web hợp pháp và mạo danh cửa hàng đồ thể thao nổi tiếng bằng cách phát hiện ra rằng logo thật đang được sử dụng với giá thấp bất thường và địa chỉ web đáng ngờ.
Điểm giống nhau: Nguyên tắc thực thi cốt lõi
  • Con người vẫn là yếu tố trung tâm: Con người vẫn đóng vai trò then chốt trong cách chúng tôi thực thi đối với nội dung. Đội ngũ chuyên gia là những kiến trúc sư tạo nên quy trình thực thi bằng AI của Meta. Họ đề ra chính sách, đào tạo mô hình, kiểm nghiệm hiệu quả, cũng như xử lý các quyết định có rủi ro và tác động cao, chẳng hạn như đưa ra quyết định cuối cùng về kháng nghị liên quan đến việc vô hiệu hóa tài khoản và thông báo cho cơ quan hành pháp khi luật pháp yêu cầu.
  • Tiêu chuẩn cộng đồng: Tiêu chuẩn cộng đồng của chúng tôi không thay đổi trong quá trình chuyển đổi này. Tiêu chuẩn đó sẽ tiếp tục đặt ra quy tắc về những gì được phép và không được phép xuất hiện trên các nền tảng của chúng tôi. Chúng tôi chỉ thay đổi cách thực thi các chính sách này.
  • Báo cáo và kháng nghị: Bạn vẫn có thể báo cáo nội dung mà mình cho là vi phạm chính sách của chúng tôi. Ngoài ra, nếu chúng tôi áp dụng biện pháp xử lý đối với nội dung hoặc tài khoản của bạn, bạn vẫn có thể kháng nghị quyết định đó.
Cách hoạt động
Cách tiếp cận của chúng tôi kết hợp khả năng của AI với chuyên môn của con người trong toàn bộ quy trình.
Thử nghiệm nghiêm ngặt trước khi triển khai
Trước khi bất kỳ hệ thống AI nào đưa ra quyết định thực thi thực sự, chúng tôi sẽ thử nghiệm nghiêm ngặt và tích hợp các biện pháp bảo vệ. Chúng tôi so sánh các quyết định của công nghệ với quyết định của đội ngũ xét duyệt có kinh nghiệm nhất, đồng thời chỉ triển khai công nghệ khi nhận thấy rằng công nghệ này liên tục hoạt động hiệu quả hơn các phương thức thực thi hiện tại đối với nội dung.
Tiêu chuẩn chất lượng rõ ràng
Mọi mô hình đều phải đáp ứng các tiêu chuẩn cụ thể về độ chính xác trước khi được triển khai. Chúng tôi đánh giá hiệu quả để đảm bảo tính nhất quán, sự hữu hiệu, tính công bằng và chính xác, từ đó chắc chắn rằng mình đang xác định đúng các trường hợp vi phạm thực tế, cũng như phân biệt giữa nội dung vi phạm và không vi phạm.
Giám sát liên tục
Sau khi được triển khai, mỗi mô hình sẽ liên tục được đánh giá. Chúng tôi theo dõi độ chính xác, giám sát những thay đổi ngoài dự kiến về hiệu quả và có thể nhanh chóng điều chỉnh hoặc tinh chỉnh mô hình nếu phát sinh vấn đề. Hệ thống của chúng tôi được thiết kế để lặp lại và hiệu chỉnh nhanh chóng – các đội ngũ và công nghệ xem xét xu hướng để phát hiện vấn đề từ sớm.
Chuyên môn của con người ở mọi giai đoạn
Con người thiết kế chính sách. Con người huấn luyện AI. Con người giám sát hiệu quả. Con người đưa ra những quyết định khó khăn, phức tạp và quan trọng nhất. AI giúp thực thi tốt hơn trên quy mô lớn và cải thiện tính nhất quán; con người đưa ra phán đoán và giám sát hệ thống.
Hiệu quả trong các lĩnh vực chính sách
Các mô hình AI của chúng tôi đang cho thấy những điểm cải thiện ngay cả khi thử nghiệm ở giai đoạn đầu đối với một số lĩnh vực chính sách:
Gian lận và lừa đảo
Một giải pháp AI được thiết kế nhằm ngăn chặn những kẻ lừa đảo lừa mọi người cung cấp thông tin đăng nhập đã phát hiện và ngăn chặn thành công 5.000 hành vi lừa đảo mỗi ngày. Đây là những trường hợp mà không đội ngũ xét duyệt hiện có nào phát hiện được trước đây.
Nội dung người lớn vi phạm
Hệ thống AI được xây dựng nhằm phát hiện hành vi gạ gẫm tình dục người lớn vi phạm đã phát hiện nhiều nội dung vi phạm hơn gấp 2 lần so với con người, đồng thời giảm hơn 60% tỷ lệ sai sót. Điều này nghĩa là chúng tôi đang và sẽ gỡ nội dung có hại nhanh hơn, đồng thời bảo vệ thêm nhiều người khỏi quá trình thực thi không đúng.
Mạo danh
AI đã giảm 80% số báo cáo của người dùng về hành vi mạo danh người nổi tiếng. Thay vì chỉ so khớp tên, AI có thể nhận ra khi ai đó đang giả mạo người của công chúng bằng cách phân tích thêm bối cảnh - chi tiết trên trang cá nhân, thói quen đăng bài và đặc điểm liên quan cho thấy hành vi không trung thực.
Hướng tới tương lai
Quá trình chuyển tiếp này sẽ diễn ra theo từng giai đoạn và thử nghiệm kỹ lưỡng ở mỗi bước. Chúng tôi đăng dữ liệu thực thi trong Báo cáo thực thi Tiêu chuẩn cộng đồng và sẽ tiếp tục chia sẻ những gì mình học được – bao gồm cả thành công lẫn thách thức – khi quy trình thực thi bằng AI mở rộng sang nhiều lĩnh vực chính sách khác. Chúng tôi cũng dự định củng cố đội ngũ chuyên trách của Meta trên toàn cầu, trong đó mỗi thành viên đều có chuyên môn sâu về việc áp dụng các tiêu chuẩn và chính sách.
Việc minh bạch về quá trình chuyển tiếp này và quy trình thực thi của chúng tôi đều rất quan trọng. Để tìm hiểu thêm về cách chúng tôi xử lý các trường hợp vi phạm hiện nay, hãy xem bài viết Xử lý. Để biết chi tiết về chính sách của chúng tôi, hãy xem Tiêu chuẩn cộng đồng. Chúng tôi thường xuyên tương tác với nhiều bên liên quan khác nhau trong quá trình phát triển chính sách và sẽ tiếp tục làm như vậy trong suốt quá trình chuyển tiếp này, đồng thời phối hợp với các nhà quản lý, chuyên gia bên ngoài và Ủy ban Giám sát để lấy ý kiến đóng góp về cách làm của mình.
Cách tiếp cận của chúng tôi được thiết kế nhằm thích ứng với những mối đe dọa mới, tiếng lóng không ngừng thay đổi và những thách thức mới xuất hiện như ngôn từ ám hiệu trong hoạt động buôn bán chất cấm, chất gây nghiện. Cách tiếp cận này dựa trên nguyên tắc là kết hợp công nghệ tiên tiến với khả năng phán đoán của con người để đem lại kết quả tốt nhất.