Οδηγούμε τον κλάδο της τεχνητής νοημοσύνης μπροστά, με ανοιχτές και συλλογικές προσπάθειες
Οι προκλήσεις του επιβλαβούς περιεχομένου επηρεάζουν ολόκληρο τον κλάδο της τεχνολογίας και την κοινωνία συνολικά. Γι' αυτό, η τεχνολογία μας είναι ανοιχτού κώδικα, ώστε να μπορεί να χρησιμοποιηθεί και από άλλους. Πιστεύουμε ότι, μέσα από τη διαφάνεια και τη συνεργασία με την κοινότητα της τεχνητής νοημοσύνης, θα ενισχυθεί η έρευνα και η ανάπτυξη, θα δημιουργηθούν νέοι τρόποι εντοπισμού και αποτροπής του επιβλαβούς περιεχομένου και θα ενισχυθεί η ασφάλεια των χρηστών.
Ακολουθούν ορισμένες τεχνολογικές λύσεις που έχουμε διαθέσει σε μορφή ανοιχτού κώδικα τα τελευταία χρόνια, μεταξύ των οποίων και 2 διαγωνισμοί που ήταν δική μας πρωτοβουλία:
Το XLM-R είναι ένα μοντέλο μηχανικής μάθησης που εκπαιδεύεται σε μία γλώσσα και, στη συνέχεια, χρησιμοποιείται σε άλλες γλώσσες χωρίς επιπρόσθετα δεδομένα εκπαίδευσης. Καθώς οι χρήστες δημοσιεύουν περιεχόμενο σε περισσότερες από 160 γλώσσες στις τεχνολογίες του Meta, το XLM-R μας επιτρέπει να χρησιμοποιούμε ένα μοντέλο για πολλές γλώσσες αντί για ένα μοντέλο ανά γλώσσα. Αυτό μας βοηθά να αναγνωρίζουμε ευκολότερα τις εκφράσεις μίσους και άλλο παραβατικό περιεχόμενο σε μια ευρεία γκάμα γλωσσών και να κυκλοφορούμε προϊόντα σε πολλές γλώσσες ταυτόχρονα. Τα μοντέλα και ο κώδικάς μας διατίθενται σε μορφή ανοιχτού κώδικα, ώστε η ερευνητική κοινότητα να μπορεί να βελτιώνει την απόδοση των πολύγλωσσων μοντέλων της. Στόχος: Να προσφέρουμε στους χρήστες την καλύτερη δυνατή εμπειρία στις πλατφόρμες μας, ανεξάρτητα από τη γλώσσα που μιλούν.
Το Linformer είναι μια αρχιτεκτονική μετασχηματισμού που αναλύει δισεκατομμύρια στοιχεία περιεχομένου στο Facebook και στο Instagram σε διαφορετικές περιοχές του κόσμου. Το Linformer συμβάλλει στον εντοπισμό των εκφράσεων μίσους και του περιεχομένου που υποκινεί τη βία. Δημοσιεύσαμε την έρευνά μας και διαθέσαμε το Linformer σε μορφή ανοιχτού κώδικα, ώστε να μπορούν να βελτιώσουν τα μοντέλα τους και άλλοι ερευνητές και προγραμματιστές. Στόχος: Δημιουργία ενός νέου μοντέλου τεχνητής νοημοσύνης που μαθαίνει από το κείμενο, τις εικόνες και την ομιλία, και εντοπίζει αποτελεσματικά τις εκφράσεις μίσους, το περιεχόμενο που αφορά την εμπορία ανθρώπων, το εκφοβιστικό περιεχόμενο και άλλες μορφές επιβλαβούς περιεχομένου.
Deepfakes Detection Challenge
Δημιουργήσαμε έναν διαγωνισμό με τη Microsoft, την Partnership on AI και ακαδημαϊκούς από πολλά πανεπιστήμια με αντικείμενο την τεχνολογία που μπορεί να εντοπίσει καλύτερα πότε έχει χρησιμοποιηθεί τεχνητή νοημοσύνη για την τροποποίηση ενός βίντεο με σκοπό την παραπλάνηση των θεατών. Η συνεισφορά μας στον διαγωνισμό Deepfakes Detection Challenge αφορούσε την παροχή ενός ρεαλιστικού συνόλου δεδομένων για τον εντοπισμό των deepfake βίντεο, κάτι που έλειπε από τον κλάδο. Στόχος: Κινητοποίηση του κλάδου αναφορικά με τη δημιουργία νέων τρόπων εντοπισμού και αποτροπής της χρήσης μέσων που έχουν παραποιηθεί μέσω τεχνητής νοημοσύνης για την παραπλάνηση του κοινού.
Δημιουργήσαμε έναν διαγωνισμό με την Getty Images και την DrivenData για την επιτάχυνση της έρευνας γύρω από τον εντοπισμό των εκφράσεων μίσους που συνδυάζουν εικόνες και κείμενο. Η συνεισφορά μας στο Hateful Memes Challenge ήταν ότι δημιουργήσαμε ένα μοναδικό σύνολο δεδομένων με περισσότερα από 10.000 παραδείγματα, τα οποία μπορούν να χρησιμοποιήσουν εύκολα οι ερευνητές στη δουλειά τους. Στόχος: Κινητοποίηση του κλάδου αναφορικά με τη δημιουργία νέων προσεγγίσεων και μεθόδων για τον εντοπισμό των πολυτροπικών εκφράσεων μίσους.