Ένα πρόγραμμα που «τραγουδά» τις φωτογραφίες σας

Γνωστό στους δημιουργούς του ως «Neural Karaoke», το πρόγραμμα Τεχνητής Νοημοσύνης που ανέπτυξε το πανεπιστήμιο του Τορόντο μπορεί να πάρει οποιαδήποτε ψηφιακή φωτογραφία και να δημιουργήσει για αυτήν ένα τραγούδι -συμπεριλαμβανομένης της μουσικής και των στίχων. Πρόκειται για μια διαφορετική επίδειξη του τι μπορεί να κάνει ένα πρόγραμμα τεχνητής νοημοσύνης -εκτός να δώσει φωνή σε ένα chatbot, να «εξαφανίσει» δισεκατομμύρια από το χρηματιστήριο και εντέλει να καταστρέψει την ανθρώπινη φυλή!

«Έχουμε συνηθίσει να σκεφτόμαστε την τεχνητή νοημοσύνη για πράγματα που αφορούν κυρίως τη ρομποτική. Το ερώτημα πλέον είναι τι μπορεί να κάνει η AI για εμάς;», δήλωσε στη βρετανική εφημερίδα The Guardian η Ρακέλ Ούρτασαν, μέλος της ομάδας ανάπτυξης του προγράμματος. «Μπορείτε να φανταστείτε ένα κανάλι AI στο Spotify να παράγει μουσική ή να “βλέπει” τις φωτογραφίες ανθρώπων και να τραγουδά αποκλειστικά για αυτούς; Πρόκειται για το τι μπορεί να κάνει στις μέρες μας η Βαθιά Μάθηση ώστε να γίνει η ζωή μας πιο διασκεδαστική», πρόσθεσε η ίδια.

Το Neural Karaoke προέκυψε κατά τη διάρκεια μιας ευρύτερης προσπάθειας ερευνητών να χρησιμοποιήσουν προγράμματα ηλεκτρονικών υπολογιστών προκειμένου να συνθέσουν μουσική, να γράψουν στίχους ή ακόμα και να δημιουργήσουν χορογραφίες. Μόλις το πρόγραμμα «εκπαιδευτεί» μπορεί να πάρει μια μουσική κλίμακα και ένα μελωδικό προφίλ και να δημιουργήσει μια απλή μελωδία.

Ωστόσο, η σύνθεση μουσικής ήταν μόνο η αρχή. Η ομάδα του πανεπιστημίου του Τορόντο εκπαίδευσε στη συνέχεια το πρόγραμμα να χορεύει. Αφού «παρακολούθησε» χορογραφίες από το παιχνίδι Just Dance, το πρόγραμμα κατάφερε να εντοπίσει τις ανθρώπινες στάσεις και έτσι έμαθε να συνδέει τις κινήσεις με τη μουσική. Βέβαια, το αποτέλεσμα ήταν ερασιτεχνικό, ωστόσο κανείς δεν μπορεί να περιμένει τις κινήσεις του Τραβόλτα με μία και μόνο ώρα μαθήματος.

Μία ακόμα ώρα με μελωδίες από το Just Dance και 50 ώρες ανάγνωσής στίχων από το Ίντερνετ, βοήθησαν ώστε το πρόγραμμα να μάθει πώς να βάζει λέξεις στη μουσική.

Για το τελικό στάδιο, το Neural Karaoke εκπαιδεύτηκε με μια σειρά από εικόνες και λεζάντες και πώς συγκεκριμένες λέξεις μπορούν να συνδεθούν με οπτικά μοτίβα και αντικείμενα. Όταν «δει» μια καινούρια εικόνα έχει τη δυνατότητα να βρει σχετικούς στίχους και να τους τραγουδήσει.

Η ομάδα του Τορόντο ευελπιστεί ότι, στο όχι μακρινό μέλλον, το πρόγραμμα θα είναι σε θέση να δημιουργήσει πιο πολύπλοκα τραγούδια και ακόμα να επιλέξει τα καλύτερα μέσα για μια εικόνα.

«Αντί να αγοράσει κάποιος ένα μηχάνημα καραόκε, το οποίο θα περιλαμβάνει συγκεκριμένα τραγούδια, θα μπορούσε να δημιουργήσει τη δική του μουσική καραόκε στο σπίτι του, προσθέτοντας μερικές ενδιαφέρουσες φωτογραφίες και αφήνοντας το πρόγραμμα να συνθέσει μουσική ειδικά για τον χρήστη», δήλωσε στη Guardian η Σάντζα Φίντλερ, επίσης μέλος της ομάδας του Τορόντο.

«Πιστεύω ότι οι δυνατότητες είναι απεριόριστες».

ΑΠΕ-ΜΠΕ

via