מובילים את תעשיית ה-AI קדימה בעזרת מאמצים פתוחים ושיתופיים
האתגרים הכרוכים בתוכן מזיק משפיעים על כל תעשיית הטכנולוגיה ועל החברה בכלל. לכן אנחנו מפיצים את הטכנולוגיה שלנו כקוד פתוח כדי שאחרים יוכלו להשתמש בה. אנחנו מאמינים שפתיחות ושיתוף פעולה עם קהילת ה-AI יעודדו מחקר ופיתוח, יפיקו דרכים חדשות לזהות ולמנוע תוכן מזיק ויעזרו לשמור על בטיחות האנשים.
הנה כמה פריטי טכנולוגיה שהפכנו לקוד פתוח בשנים האחרונות, כולל שתי תחרויות בתעשייה שהובלנו:
XLM-R הוא מודל למידת מכונה שמאומן בשפה אחת ולאחר מכן משמש בשפות אחרות ללא נתוני אימון נוספים. אנשים מפרסמים תוכן ביותר מ-160 שפות בטכנולוגיות של Meta, ו-XLM-R מאפשר לנו להשתמש במודל אחד לשפות רבות, במקום מודל אחד לכל שפה. זה עוזר לנו לזהות בקלות דברי שטנה ותוכן מפר אחר במגוון רחב של שפות, ולהשיק מוצרים בכמה שפות בבת אחת. הפצנו את המודלים והקוד שלנו כקוד פתוח כדי שקהילת המחקר תוכל לשפר את הביצועים של המודלים הרב-לשוניים שלה. יעד: להעניק לאנשים את החוויה הטובה ביותר בפלטפורמות שלנו, ללא קשר לשפה שהם דוברים.
Linformer היא ארכיטקטורת טרנספורמציה המנתחת מיליארדי פריטי תוכן בפייסבוק ואינסטגרם באזורים שונים ברחבי העולם. Linformer עוזרת לזהות דברי שטנה ותוכן שמסית לאלימות. פרסמנו את המחקר שלנו ופתחנו את הקוד של Linformer כדי שחוקרים ומהנדסים אחרים יוכלו לשפר את המודלים שלהם. יעד: ליצור מודל AI חדש שלומד מטקסט, מתמונות ומדיבור ומזהה ביעילות דברי שטנה, סחר בבני אדם, בריונות וצורות נוספות של תוכן מזיק.
האתגר של זיהוי זיופי דיפ פייק
יצרנו תחרות יחד עם Microsoft, Partnership on AI ואנשי אקדמיה מכמה אוניברסיטאות כדי למצוא טכנולוגיה שתזהה בצורה טובה יותר מתי נעשה שימוש ב-AI כדי לשנות סרטון ולהטעות את הצופים. התרומה שלנו לאתגר הזיהוי של דיפ פייק הייתה הזמנת ערכת נתונים ריאליסטית, שלא הייתה קיימת בתעשייה, כדי לעזור לזהות זיופי דיפ פייק. יעד: לעודד את התעשייה ליצור דרכים חדשות לזהות ולמנוע שימוש במדיה שעברה מניפולציה על ידי AI במטרה להטעות אנשים.
אתגר הממים המכילים דברי שטנה
יצרנו תחרות ביחד עם Getty Images ו-DrivenData כדי להאיץ מחקר על הבעיה של זיהוי דברי שטנה שמשלבים תמונות וטקסט. התרומה שלנו לאתגר הממים המכילים דברי שטנה הייתה יצירת ערכת נתונים ייחודית של יותר מ-10,000 דוגמאות, כדי שחוקרים יוכלו להשתמש בהן בקלות בעבודתם. יעד: לעודד את התעשייה ליצור גישות ושיטות חדשות לזיהוי דברי שטנה מולטי-מודאליים.