Το πρώτο σύστημα τεχνητής νοημοσύνης, το οποίο έχει τη δυνατότητα να μεταφράσει μία προφορική γλώσσα, ανακοίνωσε πως ανέπτυξε η Meta.
Γίνεται λόγος για τα Hokkien, προφορική γλώσσα που χρησιμοποιούν κυρίως οι Κινέζοι της διασποράς και μία από τις εθνικές γλώσσες της Ταϊβάν.
Στόχος της εταιρείας, όπως αναφέρεται στο σχετικό ενημερωτικό σημείωμα, είναι να «καταρρίψει τους γλωσσικούς φραγμούς και να οικοδομήσει έναν κόσμο ενωμένο μέσω της γλώσσας».
Σύμφωνα με το about.fb.com, τα περισσότερα υπάρχοντα μοντέλα επικεντρώνονται, κατά κύριο λόγο, σε γραπτές γλώσσες αλλά υπάρχουν χιλιάδες άλλες, όπως τα Hokkien που χρησιμοποιούνται μόνο προφορικά. Ο μεταφραστής ομιλίας της Meta είναι ο πρώτος που μπορεί να χρησιμοποιηθεί κυρίως για μια προφορική γλώσσα.
Η μετάφραση ομιλίας με τεχνητή νοημοσύνη έχει επικεντρωθεί κυρίως στις γραπτές γλώσσες, ωστόσο σχεδόν 3.500 ζωντανές γλώσσες είναι κυρίως προφορικές και δεν έχουν ένα ευρέως χρησιμοποιούμενο σύστημα γραφής. Αυτό καθιστά αδύνατη τη δημιουργία εργαλείων αυτόματης μετάφρασης με τη χρήση τυποποιημένων τεχνικών, οι οποίες απαιτούν μεγάλες ποσότητες γραπτού κειμένου προκειμένου να εκπαιδευτεί ένα μοντέλο ΤΝ.
Για την αντιμετώπιση αυτής της πρόκλησης, η Meta το πρώτο σύστημα μετάφρασης ομιλίας σε ομιλία με τεχνητή νοημοσύνη για τα Hokkien, μια γλώσσα που ομιλείται κυρίως προφορικά και είναι ευρέως διαδεδομένη στην κινεζική διασπορά, αλλά δεν έχει τυποποιημένη γραπτή μορφή.
Πρόκειται για έργο του Universal Speech Translator (UST) της εταιρείας, που προχωρά τομές στη μετάφραση, ανεξαρτήτως του ένα η γλώσσα είναι γραπτή ή προφορική. Η έρευνα είναι ακόμα σε προκαταρκτικό σημείο, αλλά θεωρείται ως καλό βήμα για μελλοντικές επιτυχίες.
Η μόνη επιλογή που δίνει ο μεταφραστής, προς το παρόν, είναι μεταξύ Hokkien και Αγγλικών, αλλά η Meta επισημαίνει πως οι δυνατότητες είναι ατελείωτες.
Το μέλλον της μετάφρασης από τη Meta
Αν και το μοντέλο μετάφρασης Hokkien είναι ακόμα σε εξέλιξη και μπορεί να μεταφράσει μόνο μία πλήρη πρόταση κάθε φορά, είναι ένα βήμα προς ένα μέλλον όπου η ταυτόχρονη μετάφραση μεταξύ γλωσσών είναι δυνατή. Οι τεχνικές μπορούν να επεκταθούν σε πολλές άλλες γραπτές και άγραφες γλώσσες.
Κυκλοφόρησε επίσης το SpeechMatrix, το οποίο είναι μια μεγάλη συλλογή μεταφράσεων από ομιλία σε ομιλία που αναπτύχθηκε μέσω της καινοτόμου εργαλειοθήκης επεξεργασίας φυσικής γλώσσας που ονομάζεται LASER. Αυτά τα εργαλεία θα επιτρέψουν σε άλλους ερευνητές να δημιουργήσουν τα δικά τους συστήματα μετάφρασης από ομιλία σε ομιλία και να βασιστούν στο έργο της Meta.
Και η πρόοδος της εταιρίας σε αυτό που οι ερευνητές αποκαλούν μάθηση χωρίς επίβλεψη αποδεικνύει τη δυνατότητα δημιουργίας υψηλής ποιότητας μοντέλων μετάφρασης ομιλίας σε ομιλία χωρίς ανθρώπινο σχολιασμό. Αυτό θα βοηθήσει στην επέκταση αυτών των μοντέλων ώστε να λειτουργήσουν για γλώσσες όπου δεν υπάρχουν διαθέσιμα δεδομένα εκπαίδευσης με ετικέτες για την εκπαίδευση του συστήματος.
Η έρευνα της Meta στον τομέα της τεχνητής νοημοσύνης συμβάλλει στην άρση των γλωσσικών φραγμών τόσο στον φυσικό κόσμο όσο και στο metaverse για να ενθαρρύνει τη σύνδεση και την αμοιβαία κατανόηση.