Η νέα «οπτικο-ακουστική» εκδοχή της τεχνητής νοημοσύνης

τεχνητής νοημοσύνης

Η νέα «οπτικο-ακουστική» εκδοχή της τεχνητής νοημοσύνης θεωρείται η τρίτη σε σειρά ένδειξη ότι οι σύγχρονες υπολογιστικές μηχανές μπορούν πλέον να προσομοιώνουν κάποιες θεμελιώδεις λειτουργίες του ανθρώπινου νου.

H δημιουργία μιας τεχνητής νοημοσύνης ισότιμης ή, τουλάχιστον, παρόμοιας με την ανθρώπινη αποτελεί εδώ και δεκαετίες ένα άπιαστο όνειρο για εκατοντάδες λαμπρούς ερευνητές.

Τα τελευταία χρόνια, όμως, τα πράγματα έχουν αλλάξει, κυρίως χάρη στη συνεργασία ειδικών από διαφορετικούς κλάδους: νευροεπιστήμονες, νευροψυχολόγοι, γλωσσολόγοι συνεργάζονται πλέον στενά με ειδικούς των υπολογιστών, μηχανικούς και μαθηματικούς στο πλαίσιο του μακρόπνοου αμερικανικού προγράμματος «Εγκέφαλος, Νοήσεις και Μηχανές».

Πρόκειται για μια μεγάλη διεπιστημονική προσπάθεια που προωθείται από το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT), το οποίο έχει δημιουργήσει ένα τεράστιο δίκτυο από στενά συνεργαζόμενα ερευνητικά κέντρα στις ΗΠΑ με στόχο τη δημιουργία, στο μέλλον, μιας υπολογιστικής νοημοσύνης πραγματικά ισοδύναμης με την ανθρώπινη, δεδομένου ότι η τελευταία αποτελεί το πρότυπο και το μέτρο αξιολόγησης αυτών των προσπαθειών.

Καθώς αυτά τα ερευνητικά προγράμματα τρέχουν, παράλληλα, τα υπολογιστικά συστήματα εξελίσσονται και τελειοποιούνται.

Η τελευταία αξιοσημείωτη πρόοδος πραγματοποιήθηκε, για ακόμη μια φορά στο MIT, από τον Andrew Owens και τους συνεργάτες του, οι οποίοι κατάφεραν να δημιουργήσουν ένα πρόγραμμα υπολογιστή που είναι ικανό να προσαρμόζει τους σωστούς ήχους στις εικόνες ενός βωβού βίντεο.

Για παράδειγμα, αν ο υπολογιστής «βλέπει» έναν άνθρωπο να σκάβει το χώμα, να ταράζει μια πυκνή φυλλωσιά ή να χτυπά μια καρέκλα με ένα ραβδί, το μηχάνημα μπορεί να ανασύρει -από τη βάση δεδομένων από τα προγράμματα που διαθέτει- τον αντίστοιχο ήχο και να τον προσαρμόζει σωστά στην εικόνα του βίντεο, όπως θα έκανε ένας άνθρωπος!

Για να πετύχουν αυτό το εντυπωσιακό αποτέλεσμα, δηλαδή έναν υπολογιστή ικανό να επιλέγει τους σωστούς ήχους για τα δρώμενα ενός βωβού φιλμ, οι ερευνητές χρειάστηκε να εκπαιδεύσουν τον υπολογιστή για να μπορεί να «βλέπει» 1.000 βωβά βίντεο και να «ακούει» 46.000 διαφορετικούς ήχους.

Ο λόγος που θέτουμε σε εισαγωγικά αυτές τις αισθητηριακές ικανότητες είναι ότι οι σημερινές υπολογιστικές μηχανές διαθέτουν μόνο τους αλγορίθμους που περιγράφουν, βήμα προς βήμα, αυτές τις αισθητηριακές ενέργειες.

Αναλύοντας λεπτομερώς αυτά τα αρχικά ασύνδετα μεταξύ τους οπτικά και ηχητικά δεδομένα ο υπολογιστής έμαθε σταδιακά να τα συνδυάζει: να επιλέγει δηλαδή και να προσαρμόζει τον σωστό ήχο στη βωβή εικόνα.

Για να προβλέπει σωστά τον ήχο που ταιριάζει στη βωβή εικόνα ο υπολογιστής εξετάζει λεπτομερώς τις ηχητικές ιδιότητες κάθε φωτογράμματος και τις συνδυάζει με τους ήχους που βρίσκονται αποθηκευμένοι στη βάση δεδομένων που διαθέτει.

Ετσι καταφέρνει να δημιουργεί τις λεπτές ηχητικές παραλλαγές που αντιστοιχούν στις βουβές εικόνες, π.χ. του νερού που ρέει σε ένα ποτάμι, μιας πέτρας που κυλά ή στο θρόισμα των φύλλων.

Τεχνητή νοημοσύνη

Οι μελλοντικές εφαρμογές αυτού του ευφυούς αισθητηριακού αλγόριθμου είναι πολλές: από τη χρήση του για την αυτόματη δημιουργία ηχητικών εφέ στον κινηματογράφο ή σε διάφορα θεάματα μέχρι τη ρομποτική, π.χ. μπορεί να βελτιώσει σημαντικά την ικανότητα των ρομπότ να αναγνωρίζουν τις ιδιότητες των αντικειμένων ή του περιβάλλοντος με τα οποία αλληλεπιδρούν.

«Το να είναι κάτι ικανό να προβλέπει τους ήχους είναι ένα πρώτο σημαντικό βήμα για να αποκτήσει την ικανότητα να προβλέπει τις συνέπειες από τη φυσική αλληλεπίδραση με τον κόσμο που το περιβάλλει», όπως ορθά παρατηρεί ο Andrew Owens.

Εκτός όμως από τις πρακτικές εφαρμογές, η έρευνα αυτή έχει και σημαντικές επιπτώσεις στη θεωρία της Τεχνητής Νοημοσύνης.

Πράγματι, οι ειδικοί θεωρούν ότι ο συγκεκριμένος αλγόριθμος είναι ένα πρόγραμμα υπολογιστή που περνά επιτυχώς το περίφημο τεστ Τιούρινγκ, τη δοκιμασία δηλαδή που μας επιτρέπει να αποφασίζουμε αν μια μηχανή διαθέτει ή όχι ανθρώπινου τύπου νοημοσύνη.

Πράγματι, αυτή η νέα «οπτικο-ακουστική» εκδοχή της τεχνητής νοημοσύνης θεωρείται η τρίτη σε σειρά ένδειξη ότι οι σύγχρονες υπολογιστικές μηχανές μπορούν πλέον να προσομοιώνουν κάποιες θεμελιώδεις λειτουργίες του ανθρώπινου νου.

Η πρώτη ένδειξη ήταν το πρόγραμμα «Eugene Goostman», ένας ψηφιακός έφηβος που έδειχνε ικανός να σκέπτεται και να μιλά. Ηταν ένα πρόγραμμα γλωσσικής ικανότητας που παρουσιάστηκε επίσημα στην Αγία Πετρούπολη τον Ιούνιο του 2014 προκαλώντας σοβαρές διενέξεις μεταξύ των ειδικών.

Τον Δεκέμβριο του 2015 στο ίδιο εργαστήριο του MIT δημιούργησαν ένα πρόγραμμα γραπτού λόγου που επίσης φαίνεται ικανό να περνά επιτυχώς το τεστ Τιούρινγκ. Τώρα, το… κακό τρίτωσε με τη νέα οπτικο-ακουστική μηχανή.

Αλαν Τιούρινγκ
Πώς το τεστ Τιούρινγκ ανιχνεύει την «ευφυΐα» των μηχανών; 

Στο περίφημο άρθρο με τίτλο «Υπολογιστικές μηχανές και νοημοσύνη» (Computing Machinery and Intelligence), που έγραψε το 1950 o Αλαν Τιούρινγκ, ο πατέρας της Επιστήμης των Υπολογιστών και της Τεχνητής Νοημοσύνης, δεν εξετάζει μόνο εξαντλητικά το πανάρχαιο ερώτημα «μπορούν οι μηχανές να σκέφτονται;» αλλά προτείνει και ένα τεστ, μια δοκιμασία για να απαντήσουμε σ’ αυτό.

Το κλασικό κείμενο του Τιούρινγκ υπάρχει μεταφρασμένο και σχολιασμένο διεξοδικά στο εξαιρετικό βιβλίο των Ντάγκλας Χόφσταντερ (D. Hofstader) και Ντάνιελ Ντένετ (D. Dennett) «Το Εγώ της Νόησης», που κυκλοφορεί από τις εκδόσεις Κάτοπτρο.

Η δοκιμασία του Τιούρινγκ βασίζεται σε ένα πανούργο παιχνίδι μίμησης που παίζεται από τρεις παίκτες. Οι δύο από αυτούς είναι άνθρωποι ενώ ο τρίτος είναι ένας ισχυρός ψηφιακός υπολογιστής.

Ο πρώτος παίκτης αναλαμβάνει τον ρόλο του «ανακριτή»: είναι ένας άνθρωπος που θέτει ερωτήματα προκειμένου να αποφασίσει ποιος από τους άλλους δύο παίκτες είναι η υπολογιστική μηχανή.

Ο δεύτερος παίκτης είναι επίσης άνθρωπος και οφείλει να απαντά πάντοτε ειλικρινά ώστε να βοηθήσει τον ανακριτή, ενώ ο τρίτος, ένας κατάλληλα προγραμματισμένος υπολογιστής, μιμείται όσο καλύτερα μπορεί την ανθρώπινη λεκτική συμπεριφορά με σκοπό να ξεγελάσει τον ανακριτή.

Στη δοκιμασία Τιούρινγκ, λοιπόν, η ικανότητα χρήσης της ανθρώπινης γλώσσας αποτελεί το επαρκές και, σε τελευταία ανάλυση, το αποφασιστικό κριτήριο για να αποφασίζουμε αν πράγματι ένα σύστημα (ανθρώπινο ή τεχνητό) διαθέτει νοημοσύνη.

Προφανώς, πρόκειται για ένα εξωγενές συμπεριφορικό κριτήριο, αφού αδιαφορεί παντελώς για το υλικό υπόστρωμα -αν είναι ένας ανθρώπινος εγκέφαλος ή ένας υπολογιστής- που παράγει τη νοήμονα συμπεριφορά.

Σύμφωνα με αυτήν τη θεμελιώδη παραδοχή του Αλαν Τιούρινγκ -αλλά και των σύγχρονων οπαδών της σκληρής εκδοχής της Τεχνητής Νοημοσύνης (hard Artificial Intelligence)- η ανθρώπινη σκέψη δεν είναι τίποτε περισσότερο από λογικός υπολογισμός, δηλαδή χειρισμός συμβόλων βάσει κανόνων, και δεν εξαρτάται ούτε περιορίζεται από το υλικό υπόστρωμα (hardware) στο οποίο πραγματοποιούνται αυτοί οι υπολογισμοί. Συνεπώς, μπορεί κάλλιστα να εκδηλώνεται τόσο σε βιολογικούς όσο και σε ηλεκτρονικούς εγκεφάλους!

Ομως, όπως αποδεικνύουν οι αποτυχίες στην υλοποίηση της τεχνητής νοημοσύνης είναι αδύνατον να παραβλέπουμε ή να υποτιμάμε τις βιολογικές, εγκεφαλικές προϋποθέσεις της νοημοσύνης.

Επιπλέον, δεν μπορούμε να αποφασίζουμε εάν μια μηχανή διαθέτει ή όχι νοημοσύνη βασιζόμενοι αποκλειστικά στην οπτική γωνία ενός τρίτου προσώπου (του ανακριτή) και όχι π.χ. σε αυτήν του πρώτου προσώπου: Εγώ σκέπτομαι, άρα είμαι νοήμων.

Το βέβαιο πάντως είναι ότι, από τη σκοπιά του πρώτου προσώπου, οι εκδηλώσεις της νόησης προϋποθέτουν την παρουσία συνείδησης και την ικανότητα κατανόησης, δύο τυπικά γνωρίσματα του ανθρώπινου νου.

http://bit.ly/29sQ0c7

Δείτε επίσης τα εξής:

Η ευτυχία θέλει περιπέτεια Η ευτυχία είναι σίγουρα στιγμές, όμως σε κάθε στιγμή ευτυχίας ανακαλύπτονται ξανά και ξανά, ανακατεμένα στη σύνθεσή της, κάποια βασικά συστατικά…Αυτά ...
Μην ξεχνάς οτι με τα «όχι» χτίζονται οι ζωές... Να μάθεις να κλείνεις τις πόρτες από εκεί που τίποτα δε σε κρατάει. Να μη γυρνάς πίσω, να μη ρίχνεις βλέμματα δεύτερα και ματιές λοξές. Να μη σε νοιάζ...