Μια ομάδα ερευνητών της αμερικανικής τεχνολογικής εταιρείας Meta ανέπτυξε ένα μοντέλο τεχνητής νοημοσύνης που μπορεί να πραγματοποιεί άμεσες μεταφράσεις ομιλίας από μια γλώσσα σε άλλη.
Τα περισσότερα υπάρχοντα συστήματα μετάφρασης χρησιμοποιούν μηχανική μάθηση και επικεντρώνονται στην επεξεργασία κειμένων ή περιλαμβάνουν πολλαπλά στάδια, όπως αναγνώριση ομιλίας, μετατροπή σε κείμενο και στη συνέχεια μετατροπή του κειμένου σε ομιλία. Επίσης, η γλωσσική κάλυψη των μοντέλων ομιλίας προς ομιλία είναι περιορισμένη σε σχέση με τα μοντέλα κειμένου προς κείμενο.
Για να αντιμετωπίσουν αυτούς τους περιορισμούς, οι ερευνητές δημιούργησαν το νέο μοντέλο SEAMLESSM4T, το οποίο επιτρέπει άμεσες μεταφράσεις σε έως 101 γλώσσες και μπορεί να οδηγήσει σε ταχύτερες μεταφράσεις, σύμφωνα με μελέτη που δημοσιεύτηκε στο περιοδικό Nature. Το μοντέλο επιτρέπει μεταφράσεις από ομιλία σε ομιλία σε 36 γλώσσες, από ομιλία σε κείμενο (σε 96 γλώσσες), από κείμενο σε ομιλία (σε 36 γλώσσες), από κείμενο σε κείμενο (σε 96 γλώσσες) και αναγνώριση ομιλίας (σε 96 γλώσσες). Όσον αφορά τις μεταφράσεις ομιλίας προς ομιλία, το SEAMLESSM4T πετυχαίνει έως και 23% μεγαλύτερη ακρίβεια σε σχέση με τα υπάρχοντα συστήματα.
Ο Τάνελ Αλουμέ, αναπληρωτής καθηγητής στο Τεχνολογικό Πανεπιστήμιο του Ταλίν στην Εσθονία, ανέφερε σε συνοδευτικό άρθρο ότι το κύριο πλεονέκτημα του μοντέλου είναι ότι όλα τα δεδομένα και ο κώδικας για τη λειτουργία και βελτιστοποίησή του είναι διαθέσιμα δημόσια. Παρά ταύτα, σημειώνει ότι υπάρχουν ακόμα προκλήσεις, όπως οι περιορισμένες γλωσσικές δυνατότητες και η δυσκολία μετάφρασης ομιλιών σε θορυβώδη περιβάλλοντα ή με έντονες προφορές, κάτι που οι ανθρώπινοι μεταφραστές χειρίζονται πιο αποτελεσματικά.

Η Άλισον Κένεκε, επίκουρη καθηγήτρια στο Πανεπιστήμιο Cornell, επεσήμανε το ενδιαφέρον ότι οι ερευνητές αξιολόγησαν την τοξική ή προσβλητική γλώσσα που μπορεί να παραχθεί από το σύστημα και διερεύνησαν τη μεροληψία λόγω φύλου στις μεταφράσεις. Αν και οι τεχνολογίες ομιλίας είναι πιο αποτελεσματικές και οικονομικές σε σχέση με τους ανθρώπους, η Κένεκε υπογραμμίζει την ανάγκη κατανόησης των τρόπων με τους οποίους αυτές οι τεχνολογίες αποτυγχάνουν, ιδίως όταν επηρεάζουν συγκεκριμένα δημογραφικά στοιχεία.
Διαβάστε ακόμα: Τα 10 ονόματα των επιστημόνων που σημάδεψαν το 2024