TECH

Τεχνητή νοημοσύνη: Τα ανδροειδή ονειρεύονται ηλεκτρικά πρόβατα;

Τεχνητή νοημοσύνη: Τα ανδροειδή ονειρεύονται ηλεκτρικά πρόβατα;
Associated Press

Στο συναρπαστικό σύμπαν του συγγραφέα επιστημονικής φαντασίας, Φίλιπ Ντικ, η απάντηση είναι πως ναι. Το singularity (ενοποίηση ανθρώπου- μηχανής) είναι γεγονός, με τα ανδροειδή-ρέπλικες να αποτελούν στόχο ανηλεούς δίωξης από τους λεγόμενους blade runners στις ομότιτλες ταινίες-σταθμούς για το σινεμά επιστημονικής φαντασίας. 

Μπορεί τα ανδροειδή και τα ρομπότ να αποτελούν ένα εντυπωσιακό όχημα για τους δημιουργούς ιστοριών επιστημονικής φαντασίας αλλά η τεχνητή νοημοσύνη στο σήμερα, συναντάται περισσότερο στον άυλο κόσμο των αλγορίθμων και της μηχανικής μάθησης. Όταν αγοράζουμε από την Αmazon, o αλγόριθμος καταλαβαίνει τις προτιμήσεις μας και μας στέλνει συγκεκριμένες προτάσεις. Αντίστοιχα, οι αλγόριθμοι του Linkedin μας προτείνουν ανοικτές θέσεις εργασίας που ταιριάζουν στο προφίλ μας.

Η δύναμη των αλγορίθμων όμως δεν σταματά εδώ.

Ακόμα και για τους μη λάτρεις της τεχνολογίας, είναι δύσκολο να μην συναντήσει κανείς στο διαδίκτυο άρθρα και γνώμες που να μην αφορούν την τεχνητή νοημοσύνη και τη σχέση της με την τέχνη και τη δημιουργικότητα Αλγόριθμοι που δημιουργούν ψυχεδελικές εικόνες, μουσική ακόμα και φωτογραφίες ανθρώπων που δεν υπάρχουν.

Ας το παραδεχθούμε: σε πολλές περιπτώσεις, οι υπολογιστές μπορούν να θεωρηθούν πιο έξυπνοι από τους ανθρώπους: Έχουν τη δυνατότητα να σαρώσουν και να επεξεργαστούν εξαιρετικά γρήγορα μεγάλο όγκο πληροφοριών και να κάνουν πολύπλοκους μαθηματικούς υπολογισμούς. Παρ’ όλα αυτά, η πρώτη μας σκέψη είναι ότι μια μηχανή δεν θα μπορούσε να σκαρφιστεί ένα αστείο, να συνθέσει ένα μουσικό κομμάτι από την αρχή ή να γράψει ένα βιβλίο - ή μήπως όχι;

Αlpha Go: Όταν η τεχνητή νοημοσύνη νίκησε τον δημιουργό της

Πριν την εποχή της μηχανικής μάθησης, οι προγραμματιστές συμφωνούσαν σε μια κοινή παραδοχή: «Mπορείς να πάρεις, ό,τι βάλεις μέσα» που σε απλά λόγια σημαίνει ότι ένα πρόγραμμα είναι τόσο έξυπνο όσο και ο άνθρωπος που το δημιούργησε. Αυτό που θα τους άλλαζε τη συγκεκριμένη παραδοχή, ήταν ένα πρόγραμμα που αναπτύχθηκε από την εταιρία DeepMind που εξαγοράστηκε από την Google το 2014, για να παίξει το επιτραπέζιο παιχνίδι Γκο. Το όνομα αυτού Alpha Go.

Το Γκο, έχοντας μία ιστορία 2.500 ετών στην Κίνα, είναι ένα από τα πιο περίπλοκα επιτραπέζια παιχνίδια στον κόσμο που απαιτεί δημιουργικότητα και στρατηγική σκέψη. Οι δυο παίκτες, άσπρος και μαύρος, προσθέτουν εναλλάξ πέτρες στο γκόμπαν (ταμπλό) και προσπαθούν να αποκτήσουν μεγαλύτερη περιοχή αποκτώντας πέτρες του αντιπάλου τους. Το Γκο παίζεται κυρίως στην Ανατολική Ασία (Κίνα, Ιαπωνία, Κορέα κλπ.), και μέσω του διαδικτύου στον υπόλοιπο κόσμο.

Επειδή το Γκο, απαιτεί αναγνώριση προτύπων (pattern recognition) και ο αριθμός των πιθανών παιχνιδιών είναι πρακτικά ατελείωτος, εθεωρείτο απίθανο να διδαχθεί ενας υπολογιστής να το παίξει. Αυτό μέχρι το 2016, όταν σε μία μάχη «σώμα με σώμα», ο Αlpha Go νίκησε τον πρωταθλητή Λι Σεντόλ, με το συντριπτικό σκορ 4-1.

Το ερώτημα είναι πως ο Αlpha Go κατάφερε το αδιανόητο; Η φράση-κλειδί είναι η μηχανική μάθηση. Mέσω της κωδικοποίησης μερικών συγκεκριμένων κανόνων στην αρχή, ο ΑlphaGo αφέθη στην συνέχεια από τους δημιουργούς του να «γράψει» ο ίδιος τους κανόνες μέσα από επαναλαμβανόμενες δοκιμές και λάθη, μια διαδικασία η οποία αποτελεί και τη βάση της μηχανικής μάθησης (bottom-up approach). Όποτε ο AlphaGo έκανε μία νικητήρια κίνηση, μάθαινε και αύξανε τις πιθανότητες να χρησιμοποιήσει αυτή τη κίνηση ξανά. Αντίστοιχα, όταν έκανε μία κίνηση που αποδεικνυόταν λανθασμένη για το παιχνίδι, μείωνε τις πιθανότητες να την επαναλάβει. Όταν έφθασε η στιγμή ο AlphaGo να αναμετρηθεί με τον Λι Σεντόλ, είχε καταγράψει έναν τόσο μεγάλο αριθμό στρατηγικών και κινήσεων μέσω της παραπάνω διαδικασίας, που κανένας ανθρώπινος παίκτης του συγκεκριμένου παιχνιδιού δεν θα μπορούσε να φανταστεί.

Η ουσία της μηχανικής μάθησης και της ικανότητας της να γίνεται «εξυπνότερη» βρίσκεται στον αριθμό των διαθέσιμων δεδομένων και ακολουθεί την εξής απλή εξίσωση: Μεγαλύτερος όγκος δεδομένων για «εκπαίδευση» → πιο έξυπνα και αποτελεσματικότερα συστήματα.

Τα μαθηματικά, η μουσική και οι αλγόριθμοι συνδέονται μεταξύ τους

Στο βιβλίο του o The Creativity Code: How AI Is Learning to Write, Paint and Think”, ο μαθηματικός Marcus Du Sautoy αναφέρεται μεταξύ άλλων στον συνθέτη κλασσικής μουσικής Ντέιβιντ Κόουπ, ο οποίος το 1993 κυκλοφόρησε το Bach by Design, ένα άλμπουμ από πρωτότυπα κομμάτια πιάνου αντιπροσωπευτικά του ύφους του διάσημου Γερμανού συνθέτη, Γιόχαν Σεμπάστιαν Μπαχ.

Μόνο που ο δημιουργός τους δεν ήταν ούτε ο Μπαχ ούτε ο ίδιος ο Κόουπ, αλλά η Emmy, ένα λογισμικό, που απόδωσε σε τέτοιο βαθμό το ιδιαίτερο στυλ του Μπαχ, ξεγελώντας ακόμα και τους λάτρεις της μουσικής του διάσημου μουσικοσυνθέτη του 18ου αιώνα (ένα παρόμοιο πρόσφατο παράδειγμα είναι το πρόγραμμα Musenet, δημιουργός του οποίο είναι το OpenAI).

Το πως η Emmy κατάφερε να το κάνει αυτό έχει μια πολύ συγκεκριμένη επιστημονική εξήγηση. Οι συνθέτες κλασσικής μουσικής χρησιμοποιούν «αλγόριθμους» για να συνθέσουν μουσικά κομμάτια. Ξεκινούν από μια απλή μελωδία ή θέμα, και στη συνέχεια διαμορφώνουν αυτό το θέμα στη βάση μαθηματικών κανόνων. Χρησιμοποιώντας μαθηματικά, δημιουργούν επιμέρους παραλλαγές για να καταλήξουν στην τελική σύνθεση.

Μουσικοί συνθέτες με πολύ ισχυρή υπογραφή όπως για παράδειγμα ο Μότσαρτ, ακολουθούν συγκεκριμένα μαθηματικά μοτίβα για να συνθέσουν. Ο Μότσαρτ χρησιμοποιούσε το Alberti bass pattern το οποίο αποτελείτο απο 3 νότες που παίζονται με την εξής σειρά: 13231323. Η Emmy επομένως εκπαιδεύτηκε αντίστοιχα να ακολουθήσει τα μαθηματικά μοτίβα της μουσικής του Μπαχ και να τα χρησιμοποιήσει για να δημιουργήσει μουσικά κομμάτια που στο άκουσμά τους μας θυμίζουν τον διάσημο συνθέτη.

Γλώσσα και «μεγάλη εικόνα»: Tα τυφλά σημεία της τεχνητής νοημοσύνης

Η τεχνητή νοημοσύνη και οι αλγόριθμοι έχουν πλέον βρει τη θέση τους στα newsrooms μεγάλων ειδησεογραφικών οργανισμών και στη σύνταξη ειδήσεων. Το πρακτορείο Bloomberg News χρησιμοποιεί το σύστημα Cyborg, που βοηθά τους δημοσιογράφους να παράγουν χιλιάδες άρθρα σχετικά με τα οικονομικά αποτελέσματα τριμήνου των εταιρειών ενώ ανάλογο σύστημα έχει αναπτύξει και το Associated Press.

Επιπλέον ειδικά σχεδιασμένοι αλγόριθμοι που ήδη αξιοποιούνται από Bloomberg, Associated Press αλλά και Washington Post, ειδοποιούν τους συντάκτες σε περίπτωση που κάποια δεδομένα (π.χ. επιδόσεις ρεκόρ αθλητών σε αγώνες) ξεφεύγουν από το συνηθισμένο, οπότε ένας κανονικός δημοσιογράφος μπορεί να αναλάβει να γράψει κάτι πιο αναλυτικό και εμπλουτισμένο.

Από την πλευρά της η Microsoft ανακοίνωσε τις προηγούμενες μέρες ότι πρόκειται να αντικαταστήσει δεκάδες δημοσιογράφους, που εργάζονται με συμβόλαιο στην ιστοσελίδα της MSN, με τη χρήση αυτοματοποιημένων συστημάτων για την επιμέλεια των ειδήσεων (επιλογή των κατάλληλων τίτλων και φωτογραφιών).

Παρ’ όλα αυτά, η γλώσσα αποτελεί ένα από τα αδύναμα σημεία της τεχνητής νοημοσύνης.

Aς πάρουμε για παράδειγμα την συγκεκριμένη φράση στα αγγλικά: “Τhe children wont eat the grapes because theyre old”. Σ’ αντίθεση με τους ανθρώπους, ένα πρόγραμμα δεν μπορεί να καταλάβει ποιος είναι “old” στη συγκεκριμένη φράση: τα παιδιά ή τα σταφύλια. Το πώς ερμηνεύουμε μία λέξη, μία φράση εξαρτάται από τα συμφραζόμενα (context) αλλά και ένα επίπεδο κατανόησης που υπερβαίνει την απλή παράθεση λέξεων. Αυτό μπορεί να το κάνει ένας ανθρώπινος νους και όχι ένας αλγόριθμος.

Μπορούμε για παράδειγμα να δημιουργήσουμε ένα πρόγραμμα το οποίο να μιμείται το στυλ του Αλμπέρ Καμύ και να γράψει μερικές φράσεις πιστές στο ύφος του αλλά κανένα πρόγραμμα δεν είναι ικανό να συλλάβει το βαθύτερο νόημα και να δημιουργήσει μία ιστορία όπως «Ο Ξένος».

Εκτός απο τη γλώσσα, οι αλγόριθμοι φαίνεται να έχουν μια αυξημένη δυσκολία στο να δουν την μεγάλη εικόνα. Ο λόγος είναι ότι ένα πρόγραμμα που χρησιμοποιεί τεχνητή νοημοσύνη για την αναγνώριση εικόνων, μπορεί να φέρει εις πέρας αυτό το έργο με το να θέτει ερωτήσεις σχετικά με τα ξεχωριστά pixels που όλα μαζί ολοκληρώνουν την συγκεκριμένη εικόνα. Ο συνδυασμός όμως των pixels για διαφορετικές εικόνες που περιέχουν για παράδειγμα μία γάτα, είναι κάθε φορά μοναδικός. Το πρόγραμμα πρέπει επομένως να «μάθει» να συσχετίζει τα διαφορετικά pixels μεταξύ τους για να αποφαίνεται σωστά αν η συγκεκριμένα φωτογραφία που εξετάζει περιέχει μία γάτα ή όχι. Αυτός είναι και ο λόγος που σε πληθώρα websites μας ζητείται να διαλέξουμε φωτογραφίες από αυτοκίνητα, γάτες κ.λπ. για να επιβεβαιωθεί με αυτό τον τρόπο ότι είμαστε άνθρωποι κι όχι κάποιο πρόγραμμα.

Στην περίπτωση του προγράμματος DeepDream της Google πολλοί κάνουν λόγο για την ικανότητα της τεχνητής νοημοσύνης να δημιουργεί συναρπαστικά ψυχεδελικά έργα τέχνης. Η εξήγηση όμως είναι πολύ πιο πεζή. Το συγκεκριμένο πρόγραμμα λειτουργεί ως εξής: του τροφοδοτείται μια θολή εικόνα και του ζητείται να βελτιώσει αυτή την εικόνα με βάση το δικό του «γούστο». Όμως το «γούστο» του Deepdream είναι απλά τα δεδομένα που του έχουν εισαχθεί από εμάς, κι όχι αποτέλεσμα μιας δημιουργικής φαντασίας. Πολύ απλά, το DeepDream έχοντας εκπαιδευτεί με εικόνες από το Google search που περιέχουν ανθρώπους, ζώα ή άλλα αντικείμενα, καταλήγει να ερμηνεύει την δοθείσα θολή εικόνα βλέποντας σ’ αυτή μάτια, χέρια, πρόσωπα, με αποτέλεσμα να δημιουργεί ένα ομολογουμένως συναρπαστικό ψυχεδελικό αποτέλεσμα.

Η τεχνητή νοημοσύνη είναι δημιουργικό εργαλείο, όχι όμως και δημιουργός

Όταν κάνουμε λόγο για δημιουργικότητα, σίγουρα δεν έχουμε στο μυαλό ένα κλειστό σχήμα που θα μπορούσε υποθετικά να περιγράφει με την παρακάτω εξίσωση:
επεξεργασία Χ δεδομένων → παραγωγή Ψ αποτελέσματος.

Μια τέτοια «δημιουργικότητα» ανήκει στον κόσμο των αλγορίθμων και της μηχανικής μάθησης και βασίζεται στην ανθρώπινη εντολή και στα εκάστοτε δεδομένα που τροφοδοτούμε τα προγράμματα για να μας παράγουν ένα συγκεκριμένο αποτέλεσμα.

Η ανθρώπινη δημιουργικότητα είναι κάτι πολύ παραπάνω από αυτό: μέσα από ένα κείμενο, πίνακα, μουσικό κομμάτι, οι δημιουργοί ανατρέπουν ενίοτε κανόνες και παραδεδεγμένες αντιλήψεις ή «ξαναγράφουν» τους υπάρχοντες με διαφορετικό τρόπο, αλλάζοντας τη ματιά μας στον κόσμο και σ’ ό,τι μας περιβάλλει.

Ο διάσημος Γάλλος ζωγράφος, Μονέ, είναι γνωστός για τους πίνακες του που απεικονίζουν νούφαρα. Oι πίνακες αυτοί όμως είναι κάτι παραπάνω από απλά όμορφοι.

Αποτυπώνοντας τα νούφαρα με έναν εντελώς μοναδικό τρόπο, ο Monet έδειξε στον κόσμο έναν νέο τρόπο να εκτιμήσει την αλληλεπίδραση του φωτός και του χρώματος, ανοίγοντας τον δρόμο για ένα καινούριο κίνημα στη ζωγραφική, τον ιμπρεσιονισμό.

Η τεχνητή νοημοσύνη αποτελεί και αυτή ένα από τα σημαντικότερα δημιουργήματα του ανθρώπου και το σίγουρο είναι ότι ήρθε για να μείνει. Οι εξελίξεις είναι ραγδαίες, συναρπαστικές και διαγράφουν ένα μέλλον άγνωστο και εν πολλούς επικίνδυνο: To μέλλον θα δείξει αν θα μπορέσουμε ποτέ να μεταβούμε από το στάδιο της μηχανικής μάθησης σε αυτό που οι ειδικοί ονομάζουν superintelligence, GAN (general artificial intelligence) ή singularity αλλά και με ποιο κόστος, ικανοποιώντας την βαθύτερη ανάγκη μας να αντιταχθούμε στο πεπερασμένο της ύπαρξης μας μέσω της επιστήμης.

* Η Ελένη Νάτση είναι δημοσιογράφος, Marketing & Communications manager με ειδίκευση στον τεχνολογικό κλάδο, μέλος του Advanced Media Institute του Ανοικτού Πανεπιστημίου Κύπρου.