Mức độ phổ biến

NGÀY CẬP NHẬT 6 THáNG 3, 2025
Mục tiêu của chúng tôi là giảm thiểu tác động mà nội dung vi phạm chính sách gây ra đối với những người sử dụng dịch vụ của mình. Chúng tôi đo lường mức độ phổ biến của nội dung vi phạm để đánh giá hiệu quả mình đạt được so với mục tiêu đó.
Mức độ phổ biến là gì?
Mức độ phổ biến xét đến tất cả các lượt xem nội dung trên Facebook hoặc Instagram và đo lường tỷ lệ phần trăm ước tính số lượt xem mà nội dung vi phạm nhận được. (Tìm hiểu thêm về cách chúng tôi xác định lượt xem trong phần "Lý do chúng tôi đo lường mức độ phổ biến của lượt xem.") Số liệu này giả định rằng tác động do nội dung vi phạm gây ra tỷ lệ thuận với số lượt xem mà nội dung đó nhận được.
Một cách tiếp cận khác khi xem xét mức độ phổ biến là có bao nhiêu lượt xem nội dung vi phạm mà chúng tôi không ngăn chặn được do một trong hai nguyên nhân sau: 1) chúng tôi không phát hiện được nội dung vi phạm đủ sớm hoặc 2) chúng tôi bỏ sót hoàn toàn nội dung đó.
Cách đo lường mức độ phổ biến
Mức độ phổ biến của nội dung vi phạm được ước tính thông qua mẫu lượt xem nội dung trên Facebook hoặc Instagram. Cách tính như sau: ước tính số lượt xem nội dung vi phạm, rồi chia cho tổng số lượt xem nội dung ước tính trên Facebook hoặc Instagram. Nếu mức độ phổ biến của nội dung về hoạt động tình dục và ảnh khỏa thân người lớn dao động trong khoảng từ 0,18% đến 0,2%, như vậy nghĩa là cứ 10.000 lượt xem nội dung thì tính trung bình, sẽ có 18 đến 20 lượt xem nội dung vi phạm tiêu chuẩn của chúng tôi về hoạt động tình dục và ảnh khỏa thân người lớn.
1 CHẤM = 10 LƯỢT XEM
TỔNG CỘNG 10.000 LƯỢT XEM
20 LƯỢT XEM NỘI DUNG VI PHẠM
Prevalence
Nếu mức độ phổ biến là 0,2% thì nghĩa là cứ 10.000 lượt xem sẽ có 20 lượt xem nội dung vi phạm. Mặc dù con số này có thể rất thấp, nhưng ngay cả con số nhỏ nhất cũng có thể gây ra tác động đáng kể đến mọi người.
Một số loại vi phạm rất hiếm khi xuất hiện trên các dịch vụ của chúng tôi. Khả năng có người xem được loại nội dung vi phạm đó là rất thấp và chúng tôi gỡ phần lớn nội dung như vậy trước khi mọi người nhìn thấy. Do vậy, nhiều lần chúng tôi không tìm thấy đủ mẫu vi phạm để ước tính chính xác mức độ phổ biến. Trong những trường hợp như vậy, chúng tôi có thể ước tính giới hạn trên cho tần suất ai đó sẽ nhìn thấy nội dung vi phạm các chính sách này. Ví dụ: nếu giới hạn trên cho nội dung tuyên truyền khủng bố là 0,04%, điều đó nghĩa là cứ 10.000 lượt xem trên Facebook hoặc Instagram trong khoảng thời gian đó, chúng tôi ước tính có không quá 4 lượt xem nội dung vi phạm chính sách của chúng tôi về hoạt động tuyên truyền khủng bố.
Cần lưu ý rằng khi mức độ phổ biến của một loại vi phạm thấp đến mức chúng tôi chỉ có thể đưa ra giới hạn trên thì giới hạn này có thể thay đổi vài phần trăm của một điểm phần trăm giữa các khoảng thời gian báo cáo. Tuy nhiên, sự thay đổi nhỏ như thế không thể có ý nghĩa về mặt thống kê. Trong những trường hợp như vậy, các thay đổi nhỏ này cho thấy không có sự khác biệt thực sự trong mức độ phổ biến của nội dung vi phạm này trên dịch vụ.
Lý do chúng tôi đo lường mức độ phổ biến của lượt xem
Chúng tôi ước tính tần suất xem nội dung, chứ không phải lượng nội dung đã đăng, vì chúng tôi muốn xác định mức độ ảnh hưởng của nội dung đó đến mọi người trên Facebook hoặc Instagram. Nội dung vi phạm có thể được đăng một lần nhưng được xem 1.000 lần, 1 triệu lần hoặc không lần nào. Việc đo lường lượt xem nội dung vi phạm thay vì lượng nội dung vi phạm đã đăng phản ánh chính xác hơn về tác động đến cộng đồng. Mức độ phổ biến thấp vẫn có thể tương ứng với mức tác động lớn trên các dịch vụ của chúng tôi, do tổng lượt xem nội dung trên các dịch vụ đó rất lớn.
Khi nội dung xuất hiện trên màn hình của người dùng thì chúng tôi ghi thành một lượt xem nội dung. Cụ thể, lượt xem được tính khi ai đó:
  • Xem bài viết – ngay cả khi có nhiều nội dung trong bài viết đó, lượt xem sẽ được chỉ định cho bài viết
  • Nhấp để phóng to ảnh hoặc trình phát video - lượt xem được chỉ định cho ảnh hoặc video
Cách chúng tôi lấy mẫu để ước tính mức độ phổ biến
Chúng tôi ước tính mức độ phổ biến bằng cách lấy mẫu lượt xem nội dung trên Facebook hoặc Instagram.
Để thực hiện điều này, chúng tôi xem xét các mẫu lượt xem và nội dung hiển thị ở đó. Tiếp đến, chúng tôi gắn nhãn mẫu là vi phạm hoặc không vi phạm dựa theo chính sách của chúng tôi. Đội ngũ phụ trách quá trình lấy mẫu này sẽ xem xét toàn bộ bài viết để phát hiện nội dung vi phạm, ngay cả khi lượt xem đã lấy mẫu không cho thấy tất cả nội dung trong bài viết.
Bằng cách sử dụng tỷ lệ mẫu chứa nội dung vi phạm, chúng tôi ước tính tỷ lệ phần trăm của tất cả các lượt xem nội dung vi phạm. Lưu ý rằng chúng tôi không lấy mẫu từ mọi phần trên Facebook hoặc Instagram cho mỗi loại vi phạm.
Đối với một số loại vi phạm, chúng tôi dùng phương pháp lấy mẫu phân tầng để tăng tỷ lệ mẫu nếu bối cảnh cho thấy lượt xem nội dung dễ có khả năng liên quan đến nội dung vi phạm hơn. Chẳng hạn, nếu mọi người xem nội dung vi phạm trong Nhóm ở tần suất thường xuyên hơn so với trong Bảng feed, chúng tôi sẽ lấy mẫu lượt xem trong Nhóm với xác suất cao hơn so với trong Bảng feed. Một lý do khiến chúng tôi làm vậy là nhằm giảm bớt sự không chắc chắn do quá trình lấy mẫu gây ra. Chúng tôi biểu thị sự không chắc chắn này bằng cách trích dẫn giá trị theo khoảng, chẳng hạn, cứ 10.000 lượt xem thì có 18 đến 20 lượt xem nội dung vi phạm chính sách về hoạt động tình dục và ảnh khỏa thân người lớn. Khoảng này phản ánh độ tin cậy là 95%. Như vậy nghĩa là nếu thực hiện phép đo lường này 100 lần, mỗi lần dùng các mẫu khác nhau, chúng tôi dự kiến con số chính xác nằm ở mức 95 trong số 100 lần.
Đối với những loại vi phạm rất hiếm khi được xem, việc lấy mẫu đòi hỏi một lượng mẫu nội dung rất lớn thì mới ước tính được chính xác mức độ phổ biến. Trong các trường hợp này, chúng tôi chỉ có thể ước tính giới hạn trên, nghĩa là chúng tôi tin rằng mức độ phổ biến theo lượt xem của nội dung vi phạm nằm bên dưới ngưỡng đó nhưng không thể nói chính xác là dưới bao nhiêu. Độ tin cậy của chúng tôi cho các giới hạn trên này cũng là 95%.
Cảnh báo
  • Những người gắn nhãn cho mẫu của chúng tôi đôi khi cũng có sai sót, kể cả việc gắn nhãn một nội dung vi phạm là không vi phạm hoặc ngược lại. Tỷ lệ tương đối của những sai sót này có thể tác động đến quá trình đo lường mức độ phổ biến. Do đó, chúng tôi có thể có 2 người xét duyệt một mẫu để đảm bảo độ chính xác trong việc gắn nhãn. Nếu xảy ra bất đồng, chúng tôi sẽ trao quyền quyết định cuối cùng cho người thứ ba.
  • Đối với những khía cạnh như nội dung bạo lực và phản cảm, trong trường hợp có thể đánh dấu nội dung là gây khó chịu, cách chúng tôi tính mức độ phổ biến sẽ xét đến cả lượt xem nội dung đó trước khi nội dung bị che.
  • Cách đo lường mức độ phổ biến hiện tại áp dụng cho những giao diện đóng góp hơn 90% tổng số lượt xem trên Facebook và Instagram, đồng thời không xét đến các cuộc trò chuyện riêng tư trên Messenger hoặc Instagram Direct.
  • Để tạo kết quả đo lường mang tính tiêu biểu về mức độ phổ biến trên toàn cầu, chúng tôi lấy mẫu và gắn nhãn nội dung bằng nhiều ngôn ngữ đối với Facebook và Instagram. Chúng tôi tin rằng phương pháp này cung cấp được số liệu ước tính mang tính tiêu biểu trên toàn cầu, đồng thời không ngừng nỗ lực mở rộng phạm vi áp dụng của số liệu này.
  • Hoạt động thực thi chính sách về nội dung nói chung của chúng tôi (thông qua cả chuyên viên xét duyệt lẫn công nghệ) sẽ mở rộng ra nhiều ngôn ngữ hơn nữa.
Mức độ phổ biến của tài khoản giả trên Facebook
Mức độ phổ biến của tài khoản giả trên Facebook chính là tỷ lệ phần trăm ước tính các tài khoản giả đang hoạt động trên Facebook hàng tháng. Không giống mức độ phổ biến của các nội dung vi phạm, mức độ phổ biến của tài khoản giả giả định rằng tác động lên người dùng tỷ lệ thuận với số lượng tài khoản giả đang hoạt động trên Facebook, ngay cả khi mọi người chưa từng nhìn thấy hoặc gặp những tài khoản này.
Để ước tính mức độ phổ biến của tài khoản giả, chúng tôi lấy mẫu người dùng hoạt động hàng tháng và gắn nhãn họ là giả mạo hoặc không. Chúng tôi định nghĩa người dùng hoạt động hàng tháng (MAU) là người dùng Facebook đã đăng ký, đăng nhập và truy cập vào Facebook thông qua trang web của chúng tôi hay thiết bị di động hay đã dùng ứng dụng Messenger của chúng tôi (và cũng là người dùng Facebook đã đăng ký) trong vòng 30 ngày gần nhất tính từ ngày đo lường.