Τους χρήστες της Alexa πιο κοντά στους «νεκρούς συγγενείς» τους θέλει να φέρει η Amazon, επιτρέποντας διαλόγους με ένα ηλεκτρονικό σύστημα που θα μιμείται με ακρίβεια τη φωνή των αγαπημένων μας προσώπων που έχουν φύγει από τη ζωή.
Στο συνέδριο Re:Mars της Amazon στο Λας Βέγκας, ο αντιπρόεδρος και επικεφαλής επιστήμονας της ομάδας Alexa, Rohit Prasad, παρουσίασε λεπτομερώς ένα χαρακτηριστικό που επιτρέπει στη φωνητική βοηθό να αναπαράγει μια συγκεκριμένη ανθρώπινη φωνή.
Παιδί ήθελε η Alexa της Amazon να του διαβάσει παραμύθι η γιαγιά του
Στην πρώτη επίδειξη του είδους, ένα παιδί είχε ένα αίτημα για την Alexa που σε άλλες εποχές θα ακουγόταν απίστευτο: «Alexa, μπορεί η γιαγιά μου να μου διαβάσει το τέλος του Μάγου του Οζ;»
Η Alexa επιβεβαίωσε το αίτημα με την προεπιλεγμένη, ρομποτική φωνή και στη συνέχεια άλλαξε αμέσως τον τόνο της σε έναν πιο μαλακό, πιο ανθρώπινο και οικείο τόνο, μιμούμενη τη φωνή της χαμένης γιαγιάς.
Η ομάδα της Alexa ανέπτυξε ένα μοντέλο που επιτρέπει στη φωνητική βοηθό να μιλά με φωνή και ηχόχρωμα ενός συγκεκριμένου ανθρώπου, σε υψηλή ποιότητα, με αρχικό υλικό «λιγότερο από ένα λεπτό ηχογραφημένου ήχου».
Η λειτουργία αυτή βρίσκεται επί του παρόντος σε στάδιο ανάπτυξης, δήλωσε ο Prasad. Η Amazon δεν έχει προς το παρόν ανακοινώσει πότε η λειτουργία θα γίνει διαθέσιμη για το κοινό.
Ενώ η εφαρμογή θα μπορούσε να χρησιμοποιηθεί για την αναπαραγωγή οποιασδήποτε φωνής, ο Prasad πρότεινε τη χρήση για την διατήρηση της φωνής κάποιου αποθανόντος μέλους της οικογένειας.
Η ανάπτυξη των συστημάτων τεχνητής νοημοσύνης ώστε να μπορεί να συνομιλεί με οικειότητα, είναι από τα «ιερά δισκοπότηρα» των ομάδων A.I, δεδομένου ότι «τόσοι πολλοί από έχουμε χάσει κάποιον που αγαπάμε», μέσα στην πανδημία, σχολίασε ο Prasad.
«Ενώ η τεχνητή νοημοσύνη δεν μπορεί να εξαλείψει τον πόνο της απώλειας, μπορεί σίγουρα να δώσει διάρκεια στις αναμνήσεις», πρόσθεσε.
Ο τεχνολογικός κολοσσός θέλει να κάνει τη συνομιλία με την Alexa πιο φυσική και έχει ήδη αναπτύξει μια σειρά από χαρακτηριστικά που επιτρέπουν στη φωνητική βοηθό να αναπαράγει πιο πειστικά τον ανθρώπινο διάλογο – ακόμη και να κάνει ερωτήσεις στον χρήστη.