Πώς επενδύει το Meta στην τεχνολογία

ΕΝΗΜΕΡΩΘΗΚΕ 19 Ιαν 2022
Επενδύουμε στην τεχνητή νοημοσύνη για τη βελτίωση της ικανότητάς μας να εντοπίζουμε παραβατικό περιεχόμενο και να κρατάμε τους χρήστες ασφαλείς. Είτε πρόκειται για βελτίωση ενός υπάρχοντος συστήματος είτε για εισαγωγή ενός νέου, αυτές οι επενδύσεις μάς βοηθούν να αυτοματοποιήσουμε τις αποφάσεις σχετικά με το περιεχόμενο ώστε να μπορούμε να ανταποκρινόμαστε ταχύτερα και να μειώνουμε τα λάθη.
Ακολουθούν ορισμένες από τις επενδύσεις που έχουμε κάνει στην τεχνολογία τεχνητής νοημοσύνης για τη βελτίωση του τρόπου με τον οποίο κατανοούν τα εργαλεία μας το περιεχόμενο:
  • Αναπτύξαμε μια νέα αρχιτεκτονική που λέγεται Linformer, η οποία αναλύει περιεχόμενο στο Facebook και στο Instagram σε διαφορετικές περιοχές του κόσμου.
  • Δημιουργήσαμε ένα νέο σύστημα που λέγεται Reinforced Integrity Optimizer, το οποίο μαθαίνει από διαδικτυακά σήματα, ώστε να βελτιώσουμε την ικανότητά μας να εντοπίζουμε τις εκφράσεις μίσους.
  • Βελτιώσαμε ένα εργαλείο αντιστοίχισης εικόνων που λέγεται SimSearchNet, το οποίο βοηθάει την τεχνολογία μας να εντοπίζει λεπτές διαφοροποιήσεις στο περιεχόμενο, ώστε να μπορούμε να προβαίνουμε στις κατάλληλες ενέργειες για την παραπληροφόρηση.
  • Ενσωματώσαμε τα γλωσσικά εργαλεία XLM και XLM-R, τα οποία μας βοηθούν να δημιουργούμε εργαλεία ταξινόμησης που κατανοούν την ίδια έννοια σε πολλές γλώσσες. Αυτό σημαίνει ότι, όταν η τεχνολογία μας μπορεί να μάθει σε μία γλώσσα, μπορεί να βελτιώσει την απόδοσή της σε άλλες, κάτι που είναι ιδιαιτέρως χρήσιμο για τις γλώσσες που είναι λιγότερο διαδεδομένες στο διαδίκτυο.
  • Δημιουργήσαμε ένα σύστημα κατανόησης ολόκληρων οντοτήτων, το οποίο αναλύει το περιεχόμενο για να προσδιορίσει αν περιέχει εκφράσεις μίσους.
Οδηγούμε τον κλάδο της τεχνητής νοημοσύνης μπροστά, με ανοιχτές και συλλογικές προσπάθειες
Οι προκλήσεις του επιβλαβούς περιεχομένου επηρεάζουν ολόκληρο τον κλάδο της τεχνολογίας και την κοινωνία συνολικά. Γι' αυτό, η τεχνολογία μας είναι ανοιχτού κώδικα, ώστε να μπορεί να χρησιμοποιηθεί και από άλλους. Πιστεύουμε ότι, μέσα από τη διαφάνεια και τη συνεργασία με την κοινότητα της τεχνητής νοημοσύνης, θα ενισχυθεί η έρευνα και η ανάπτυξη, θα δημιουργηθούν νέοι τρόποι εντοπισμού και αποτροπής του επιβλαβούς περιεχομένου και θα ενισχυθεί η ασφάλεια των χρηστών.
Ακολουθούν ορισμένες τεχνολογικές λύσεις που έχουμε διαθέσει σε μορφή ανοιχτού κώδικα τα τελευταία χρόνια, μεταξύ των οποίων και 2 διαγωνισμοί που ήταν δική μας πρωτοβουλία:
Το XLM-R είναι ένα μοντέλο μηχανικής μάθησης που εκπαιδεύεται σε μία γλώσσα και, στη συνέχεια, χρησιμοποιείται σε άλλες γλώσσες χωρίς επιπρόσθετα δεδομένα εκπαίδευσης. Καθώς οι χρήστες δημοσιεύουν περιεχόμενο σε περισσότερες από 160 γλώσσες στις τεχνολογίες του Meta, το XLM-R μας επιτρέπει να χρησιμοποιούμε ένα μοντέλο για πολλές γλώσσες αντί για ένα μοντέλο ανά γλώσσα. Αυτό μας βοηθά να αναγνωρίζουμε ευκολότερα τις εκφράσεις μίσους και άλλο παραβατικό περιεχόμενο σε μια ευρεία γκάμα γλωσσών και να κυκλοφορούμε προϊόντα σε πολλές γλώσσες ταυτόχρονα. Τα μοντέλα και ο κώδικάς μας διατίθενται σε μορφή ανοιχτού κώδικα, ώστε η ερευνητική κοινότητα να μπορεί να βελτιώνει την απόδοση των πολύγλωσσων μοντέλων της.
Στόχος: Να προσφέρουμε στους χρήστες την καλύτερη δυνατή εμπειρία στις πλατφόρμες μας, ανεξάρτητα από τη γλώσσα που μιλούν.
Το Linformer είναι μια αρχιτεκτονική μετασχηματισμού που αναλύει δισεκατομμύρια στοιχεία περιεχομένου στο Facebook και στο Instagram σε διαφορετικές περιοχές του κόσμου. Το Linformer συμβάλλει στον εντοπισμό των εκφράσεων μίσους και του περιεχομένου που υποκινεί τη βία. Δημοσιεύσαμε την έρευνά μας και διαθέσαμε το Linformer σε μορφή ανοιχτού κώδικα, ώστε να μπορούν να βελτιώσουν τα μοντέλα τους και άλλοι ερευνητές και προγραμματιστές.
Στόχος: Δημιουργία ενός νέου μοντέλου τεχνητής νοημοσύνης που μαθαίνει από το κείμενο, τις εικόνες και την ομιλία, και εντοπίζει αποτελεσματικά τις εκφράσεις μίσους, το περιεχόμενο που αφορά την εμπορία ανθρώπων, το εκφοβιστικό περιεχόμενο και άλλες μορφές επιβλαβούς περιεχομένου.
Δημιουργήσαμε έναν διαγωνισμό με τη Microsoft, την Partnership on AI και ακαδημαϊκούς από πολλά πανεπιστήμια με αντικείμενο την τεχνολογία που μπορεί να εντοπίσει καλύτερα πότε έχει χρησιμοποιηθεί τεχνητή νοημοσύνη για την τροποποίηση ενός βίντεο με σκοπό την παραπλάνηση των θεατών. Η συνεισφορά μας στον διαγωνισμό Deepfakes Detection Challenge αφορούσε την παροχή ενός ρεαλιστικού συνόλου δεδομένων για τον εντοπισμό των deepfake βίντεο, κάτι που έλειπε από τον κλάδο.
Στόχος: Κινητοποίηση του κλάδου αναφορικά με τη δημιουργία νέων τρόπων εντοπισμού και αποτροπής της χρήσης μέσων που έχουν παραποιηθεί μέσω τεχνητής νοημοσύνης για την παραπλάνηση του κοινού.
Δημιουργήσαμε έναν διαγωνισμό με την Getty Images και την DrivenData για την επιτάχυνση της έρευνας γύρω από τον εντοπισμό των εκφράσεων μίσους που συνδυάζουν εικόνες και κείμενο. Η συνεισφορά μας στο Hateful Memes Challenge ήταν ότι δημιουργήσαμε ένα μοναδικό σύνολο δεδομένων με περισσότερα από 10.000 παραδείγματα, τα οποία μπορούν να χρησιμοποιήσουν εύκολα οι ερευνητές στη δουλειά τους.
Στόχος: Κινητοποίηση του κλάδου αναφορικά με τη δημιουργία νέων προσεγγίσεων και μεθόδων για τον εντοπισμό των πολυτροπικών εκφράσεων μίσους.