출현율

업데이트됨 2025. 3. 6.
Meta의 목표는 저희 서비스를 이용하는 사람들이 정책 위반으로 인해 받는 영향을 최소화하는 것입니다. 위반 콘텐츠의 출현율은 저희가 이러한 목표를 얼마나 잘 달성하고 있는지 가늠할 수 있는 지표입니다.
출현율이란?
출현율에서는 Facebook 또는 Instagram의 모든 콘텐츠 조회수를 고려하고 위반 콘텐츠 조회수의 예상 비율을 측정합니다. 조회수를 정의하는 방식에 대한 자세한 내용은 '조회수 출현율을 측정하는 이유'를 참조하세요. 이 지표에서는 위반 콘텐츠가 미치는 영향은 콘텐츠가 조회된 횟수에 비례한다고 가정합니다.
또한 출현율은 저희가 위반 사실을 조기에 발견하지 못했거나 전혀 발견하지 못해 차단하지 못한 위반 콘텐츠의 조회수를 의미한다고 볼 수 있습니다.
출현율 측정 방법
위반 콘텐츠의 출현율은 Facebook 또는 Instagram에서 콘텐츠 조회 샘플을 사용하여 추정합니다. 위반 콘텐츠의 추산 조회수를 Facebook 또는 Instagram의 총 추산 콘텐츠 조회수로 나누어 계산합니다. 예를 들어, 성인 나체 이미지 및 성적 행위의 출현율이 0.18%~0.20%라면 콘텐츠가 10,000번 조회될 때마다 평균 18~20회의 조회가 성인 나체 이미지 및 성적 행위에 관한 규정 위반 콘텐츠에서 발생했음을 의미합니다.
점 1개 = 조회 10회
총 조회수 10,000회
위반 콘텐츠 조회 20회
Prevalence
출현율이 0.20%라면 10,000회 조회마다 위반 콘텐츠가 20회 조회되었다는 것을 의미합니다. 숫자가 매우 적더라도, 작은 수치조차 사람들에게 큰 영향을 미칠 수 있습니다.
일부 위반 유형은 저희 서비스에서 매우 드물게 발생합니다. 사람들이 위반 콘텐츠를 조회할 가능성은 매우 낮지만, 저희는 사람들이 해당 콘텐츠를 보기 전에 미리 삭제합니다. 따라서 대부분의 경우 출현율을 정확히 예측하는 데 충분한 위반 샘플을 찾을 수 없습니다. 이 경우 이러한 정책을 위반하는 콘텐츠가 노출되는 빈도의 상한값을 추정할 수 있습니다. 예를 들어, 테러리스트 선전에 대한 상한이 0.04%인 경우 해당 기간에 Facebook 또는 Instagram에서 10,000회 조회할 때마다 테러리스트 선전 정책을 위반하는 콘텐츠를 4회 이하로 조회하게 된다는 것을 의미합니다.
위반 유형의 출현율이 상한을 간신히 제시할 수 있을 정도로 낮은 경우 보고 기간 사이에 상한이 몇백분의 일 퍼센트포인트 정도 변경될 수 있습니다. 하지만 이 정도의 변경은 통계적으로 유의미하지 않을 수 있습니다. 이 경우 작은 변경이 서비스에서 위반 콘텐츠의 실제 출현율 차이를 나타내지 않습니다.
조회수 출현율을 측정하는 이유
콘텐츠가 Facebook 또는 Instagram 사용자에게 얼마나 영향을 미쳤는지를 파악하려고 하므로 게시된 콘텐츠 수보다 콘텐츠가 조회된 빈도를 추정합니다. 위반 콘텐츠가 한 번 게시될 때 1,000회 또는 100만 회 조회될 수도 있고 전혀 조회되지 않을 수도 있습니다. 게시되는 위반 콘텐츠의 양 대신 위반 콘텐츠의 조회수를 측정하면 커뮤니티에 미치는 영향이 효과적으로 반영됩니다. 저희 서비스에서는 전체 콘텐츠 조회수가 매우 높기 때문에, 출현율이 낮더라도 실제 저희 서비스에 많은 영향을 미칠 수 있습니다.
조회수는 콘텐츠가 사용자의 화면에 표시될 때 기록됩니다. 구체적으로는 다음과 같은 경우 조회로 간주됩니다.
  • 게시물 조회 - 해당 게시물에 여러 콘텐츠가 있는 경우에도 게시물을 기준으로 조회수가 기록됩니다.
  • 클릭하여 사진이나 동영상 플레이어 확대 - 사진 또는 동영상에 조회수가 기록됩니다.
샘플링을 사용하여 출현율을 예측하는 방식
Facebook 또는 Instagram에서의 콘텐츠 조회를 샘플링하여 출현율을 추정합니다.
이를 위해 조회 샘플 및 해당 콘텐츠를 검토합니다. 그런 다음 정책에 따라 샘플을 위반한 건과 위반하지 않은 건으로 분류합니다. 샘플링된 조회 건에 게시물의 모든 콘텐츠가 표시되지 않은 경우에도 게시물 전체에 대한 위반 여부를 검토합니다.
저희는 위반 콘텐츠 샘플의 일부를 사용하여 위반 콘텐츠의 총 조회 비율을 추산합니다. Facebook 또는 Instagram의 모든 부분에서 모든 위반 유형에 대한 샘플을 추출하지는 않습니다.
특정 위반 유형의 경우 저희는 층화추출법을 사용하기 때문에, 콘텐츠 조회에 위반 사항이 포함될 가능성이 높은 컨텍스트에 대한 샘플 비율이 증가합니다. 예를 들어, 위반 사항이 피드보다 그룹에서 더 자주 조회되는 경우 그룹에서 조회를 샘플링할 확률이 피드에서 조회를 샘플링할 확률보다 더 높습니다. 이는 샘플링으로 인한 불확실성을 줄이기 위해서입니다. 저희는 값을 범위로 표현(예: 10,000회 조회 중 18~20회가 성인 나체 이미지 및 성적 행위에 관한 규정을 위반했다고 언급)하여 이러한 불확실성을 나타내며, 이 범위는 95% 신뢰 구간을 반영합니다. 즉, 매번 다른 샘플을 사용하여 100번 측정하면 실제 값이 100번 중 95번 범위에 포함될 것으로 예상됩니다.
매우 드물게 조회되는 위반 유형의 경우 샘플을 추출하여 출현율을 정밀하게 예측하려면 매우 많은 콘텐츠 샘플이 필요합니다. 그러므로 이 경우 상한만 추정할 수 있습니다. 즉, 위반 조회의 실제 출현율은 상한 이하라고 확신할 수 있지만, 정확한 차이는 알 수 없습니다. 또한 상한에 대한 신뢰 구간은 95%입니다.
주의 사항
  • 샘플을 분류하는 사람이 위반 사항을 위반하지 않은 것으로 분류하거나, 반대로 위반하지 않은 사항을 위반한 것으로 분류하는 등의 실수를 하는 경우도 있습니다. 이러한 실수의 상대적인 비율이 출현율 측정에 영향을 미칠 수 있습니다. 이러한 이유로 저희는 레이블이 정확하게 지정되도록 두 사람이 샘플을 검토하고, 의견이 서로 충돌할 경우 세 번째 사람이 결정을 내리도록 합니다.
  • 내용이 충격적일 수 있는 폭력적이고 자극적인 콘텐츠와 같은 영역의 경우, 출현율 계산에서 콘텐츠를 가리기 이전에 조회된 횟수가 계산됩니다.
  • 현재 출현율 측정에는 Facebook 및 Instagram에서 전체 조회의 90% 이상에 기여한 노출은 포함되고 Messenger 또는 Instagram Direct에서 진행된 비공개 대화는 포함되지 않습니다.
  • 대표적인 글로벌 출현율 지표를 생성하기 위해 Facebook 및 Instagram에서 콘텐츠를 여러 언어로 샘플링하여 레이블을 지정합니다. 또한 이 접근 방법이 대표적인 전역 추정치를 제공한다고 신뢰하며, 지표의 범위를 지속적으로 확장하기 위해 노력합니다.
  • 검토자와 기술을 통한 전체 콘텐츠 시행이 더 많은 언어로 확장됩니다.
Facebook의 가짜 계정 출현율
Facebook의 가짜 계정 출현율은 월간 액티브 Facebook 계정 중 가짜 계정의 비율로 추정합니다. 콘텐츠 위반 출현율과 달리 가짜 계정 출현율에서는 사람들이 이러한 계정을 직접 보거나 경험하지 않는 경우에도 Facebook 사용자에 대한 영향이 활성 상태인 가짜 계정의 수에 비례한다고 가정합니다.
가짜 계정의 출현율을 추정하기 위해 저희는 월간 액티브 사용자를 샘플링하여 가짜 또는 가짜가 아닌 사용자로 분류합니다. 월간 액티브 사용자(MAU)는 측정일 현재 최근 30일간 Facebook 웹사이트 또는 모바일 기기를 통해 로그인하고 Facebook을 방문하거나, Messenger 앱을 사용한 등록된 Facebook 사용자로 정의합니다(등록된 Facebook 사용자라고도 함).