Cách Meta huấn luyện công nghệ
NGÀY CẬP NHẬT 19 THáNG 1, 2022
Đôi khi, có những ngữ nghĩa của nội dung mà con người thấy rõ ngay nhưng công nghệ lại không thực sự hiểu được. Để luôn đảm bảo an toàn cho mọi người, Meta cần huấn luyện trí tuệ nhân tạo (AI) cách phát hiện bài viết vi phạm.
Ví dụ: Nội dung sau có cả văn bản lẫn hình ảnh. Trong đó, 2 hình ảnh mang tính chất tích cực, 2 hình ảnh còn lại có khả năng mang dụng ý xấu.
Nếu không được huấn luyện đúng cách, hầu hết AI khó có thể phân biệt những nét khác nhau này. AI sẽ đọc văn bản và xác định nghĩa đen của các từ hoặc nhìn vào hình ảnh để xác định ý nghĩa chung chung của chủ thể trong ảnh. Ngược lại, con người, theo bản năng, sẽ ghép văn bản và hình ảnh với nhau để hiểu nội dung đó.
Một giải pháp của chúng tôi đối với vấn đề này là huấn luyện sao cho công nghệ nhìn vào tất cả các thành phần của bài viết trước tiên, sau đó mới xác định ý nghĩa thực sự. Việc này có thể giúp ích rất nhiều cho AI trong việc phát hiện một cách chuẩn xác hơn những gì mà con người thấy được khi xem cùng một bài viết.
Ngoài ra, chúng tôi sử dụng một hệ thống hướng dẫn AI học hỏi trực tiếp từ hàng triệu nội dung hiện có và hỗ trợ chọn dữ liệu huấn luyện phản ánh mục tiêu của chúng tôi. Hệ thống này khác với các hệ thống AI thông thường được huấn luyện dựa trên dữ liệu cố định. Thông qua phương pháp này, chúng tôi có thể bảo vệ mọi người tốt hơn khỏi ngôn từ gây thù ghét và nội dung cổ xúy bạo lực.Dù chúng tôi vẫn còn rất nhiều việc cần làm nhưng qua quá trình huấn luyện này, công nghệ của chúng tôi sẽ tiếp tục cải thiện và hiểu đúng hơn ý nghĩa thực sự của nội dung đa thể thức.