Cách hoạt động của công nghệ thực thi

NGÀY CẬP NHẬT 12 THáNG 11, 2024
Meta sử dụng công nghệ để thực thi Tiêu chuẩn cộng đồng. Các đội ngũ của chúng tôi phối hợp với nhau trong việc xây dựng và huấn luyện công nghệ. Cách hoạt động như sau.
Xây dựng mô hình và đưa ra dự đoán
Quy trình này bắt đầu từ đội ngũ trí tuệ nhân tạo. Họ xây dựng các mô hình máy học có thể thực hiện những nhiệm vụ như nhận dạng chủ thể trong ảnh hoặc hiểu văn bản. Sau đó, đội ngũ liêm chính của chúng tôi – những người chịu trách nhiệm mở rộng phạm vi phát hiện và thực thi các chính sách của chúng tôi – sẽ tiếp tục xây dựng các mô hình này để tạo ra mô hình cụ thể hơn, có nhiệm vụ đưa ra dự đoán về con người và nội dung. Những dự đoán này giúp chúng tôi thực thi chính sách.
Ví dụ: mô hình trí tuệ nhân tạo sẽ đoán xem nội dung là ngôn từ gây thù ghét hay là nội dung bạo lực và phản cảm. Một hệ thống riêng – công nghệ thực thi – sẽ xác định xem có nên xử lý hay không, chẳng hạn như xóa, hạ bậc hoặc gửi nội dung cho đội ngũ xét duyệt xem xét thêm.
Học hỏi nhờ sự lặp lại, được xác minh bởi con người
Ở bước đầu tiên khi xây dựng công nghệ mới cho việc thực thi chính sách về nội dung, chúng tôi sẽ đào tạo để công nghệ có thể tìm kiếm một số tín hiệu. Ví dụ: có công nghệ thì tìm kiếm ảnh khỏa thân, trong khi có công nghệ lại học cách hiểu văn bản. Ban đầu, một loại công nghệ mới có thể không chắc chắn lắm liệu nội dung có vi phạm chính sách của chúng tôi hay không.
Khi đó, đội ngũ xét duyệt sẽ đưa ra quyết định cuối cùng và công nghệ có thể học hỏi từng quyết định của chuyên viên. Theo thời gian – sau khi học hỏi hàng nghìn quyết định của chuyên viên – công nghệ sẽ trở nên chính xác hơn.
Các chính sách của chúng tôi cũng phát triển theo thời gian để theo kịp sự thay đổi về sản phẩm, các chuẩn mực xã hội và ngôn ngữ. Như vậy, việc đào tạo công nghệ lẫn đội ngũ xét duyệt của chúng tôi là một quy trình tuần tự và lặp lại.
Phát hiện nội dung vi phạm nhiều lần
Công nghệ làm rất tốt nhiệm vụ phát hiện nội dung lặp đi lặp lại – kể cả hàng triệu lần, nếu cần. Công nghệ của chúng tôi sẽ xử lý nội dung mới nếu nội dung đó khớp hoặc gần như giống một nội dung vi phạm khác. Điều này đặc biệt hữu hiệu đối với các chiến dịch lan truyền thông tin sai lệch, ảnh chế hoặc nội dung khác có khả năng phát tán hết sức nhanh chóng.
Phân biệt những điểm khác biệt khó thấy
Công nghệ có thể tìm và gỡ nội dung lặp đi lặp lại. Tuy nhiên, thách thức to lớn đối với máy móc là hiểu các sắc thái trong cách dùng từ hay những điểm khác biệt nhỏ có thể làm thay đổi ngữ cảnh ra sao.
Misleading content 1
Hình ảnh thứ nhất là nội dung gốc gây hiểu nhầm, chứa thông tin sai lệch về một vấn đề an toàn y tế công cộng.
Misleading content 2
Hình ảnh thứ hai là ảnh chụp màn hình của hình ảnh thứ nhất, lần này có thêm thanh menu của máy tính ở trên cùng.
Misleading content 3
Cuối cùng, hình ảnh thứ ba trông vô cùng giống 2 hình ảnh kia, nhưng có 2 điểm thay đổi nhỏ về từ ngữ khiến cho tiêu đề trở nên chính xác và không còn sai sự thật nữa.
Điều này khá dễ hiểu đối với con người nhưng công nghệ thì khó phân biệt được chính xác như vậy. Có nguy cơ diễn ra 2 thái cực sau. Nếu quá mạnh tay, công nghệ sẽ gỡ hàng triệu bài viết không vi phạm. Còn nếu không đủ mạnh tay, công nghệ sẽ cho rằng ảnh chụp màn hình có thêm thanh menu là nội dung khác với hình ảnh gốc và không xử lý nội dung này.
Chúng tôi dành nhiều thời gian khắc phục tình trạng nói trên. Trong vài năm qua, chúng tôi đã thực hiện một số hoạt động đầu tư để cải thiện khả năng phát hiện của công nghệ khi gặp những điểm khác biệt khó thấy trong nội dung. Công nghệ sẽ tiếp tục học hỏi để ngày càng trở nên chính xác hơn.
Subtile distinctions