Η μηχανική μάθηση είναι ένα υποσύνολο της τεχνητής νοημοσύνης (AI). Επικεντρώνεται στη διδασκαλία των υπολογιστών να μαθαίνουν από τα δεδομένα και να βελτιώνονται με την εμπειρία – αντί να είναι ρητά προγραμματισμένοι να το κάνουν. Στη μηχανική μάθηση, οι αλγόριθμοι εκπαιδεύονται για να βρουν μοτίβα και συσχετίσεις σε μεγάλα σύνολα δεδομένων και να λαμβάνουν τις καλύτερες αποφάσεις και προβλέψεις με βάση αυτή την ανάλυση. Οι εφαρμογές μηχανικής μάθησης βελτιώνονται με τη χρήση και γίνονται πιο ακριβείς όσο περισσότερα δεδομένα έχουν πρόσβαση.
Οι εφαρμογές της μηχανικής μάθησης βρίσκονται παντού γύρω μας – στα σπίτια μας, στα καλάθια αγορών μας, στα μέσα ψυχαγωγίας μας και στην υγειονομική μας περίθαλψη.
Πώς η μηχανική μάθηση σχετίζεται με την τεχνητή νοημοσύνη;
Η μηχανική μάθηση – και τα συστατικά της της βαθιάς μάθησης και των νευρωνικών δικτύων – όλα ταιριάζουν ως ομόκεντρα υποσύνολα της τεχνητής νοημοσύνης. Η τεχνητή επεξεργάζεται δεδομένα για να λάβει αποφάσεις και προβλέψεις. Οι αλγόριθμοι μηχανικής μάθησης επιτρέπουν στην τεχνητή νοημοσύνη όχι μόνο να επεξεργαστεί αυτά τα δεδομένα, αλλά και να τα χρησιμοποιήσει για να μάθει και να γίνει εξυπνότερο, χωρίς να χρειάζεται πρόσθετο προγραμματισμό. Η τεχνητή νοημοσύνη είναι ο γονέας όλων των υποσυνόλων μηχανικής μάθησης κάτω από αυτήν. Μέσα στο πρώτο υποσύνολο είναι η μηχανική μάθηση, μέσα σε αυτό είναι η βαθιά μάθηση, και στη συνέχεια τα νευρωνικά δίκτυα μέσα σε αυτό.
Τι είναι το νευρωνικό δίκτυο;
Ένα τεχνητό νευρωνικό δίκτυο (ANN) βασίζεται στους νευρώνες ενός βιολογικού εγκεφάλου. Οι τεχνητοί νευρώνες ονομάζονται κόμβοι και συγκεντρώνονται μαζί σε πολλαπλά στρώματα, λειτουργώντας παράλληλα. Όταν ένας τεχνητός νευρώνας λαμβάνει ένα αριθμητικό σήμα, το επεξεργάζεται και σηματοδοτεί τους άλλους νευρώνες που συνδέονται με αυτό. Όπως σε έναν ανθρώπινο εγκέφαλο, η νευρική ενίσχυση έχει ως αποτέλεσμα τη βελτίωση της αναγνώρισης προτύπων, της εμπειρογνωμοσύνης και της συνολικής μάθησης.
Τι είναι η βαθιά μάθηση;
Αυτό το είδος μηχανικής μάθησης ονομάζεται «βαθιά» επειδή περιλαμβάνει πολλά επίπεδα του νευρωνικού δικτύου και μαζικούς όγκους πολύπλοκων και ανόμοιων δεδομένων. Για να επιτύχει τη βαθιά μάθηση, το σύστημα συνδέεται με πολλαπλά επίπεδα στο δίκτυο, εξάγοντας όλο και περισσότερο εξόδους υψηλότερου επιπέδου. Για παράδειγμα, ένα σύστημα βαθιάς μάθησης που επεξεργάζεται εικόνες της φύσης και ψάχνει για μαργαρίτες θα αναγνωρίσει – στο πρώτο στρώμα – ένα φυτό. Καθώς κινείται μέσα από τα νευρωνικά στρώματα, στη συνέχεια θα αναγνωρίσει ένα λουλούδι, στη συνέχεια μια μαργαρίτα, και τελικά μια μαργαρίτα. Παραδείγματα εφαρμογών βαθιάς μάθησης περιλαμβάνουν αναγνώριση ομιλίας, ταξινόμηση εικόνας και φαρμακευτική ανάλυση.
Πώς λειτουργεί η μηχανική μάθηση;
Η μηχανική μάθηση αποτελείται από διαφορετικούς τύπους μοντέλων μηχανικής μάθησης, χρησιμοποιώντας διάφορες αλγοριθμικές τεχνικές. Ανάλογα με τη φύση των δεδομένων και το επιθυμητό αποτέλεσμα, ένα από τα τέσσερα μοντέλα μάθησης μπορεί να χρησιμοποιηθεί: επιβλεπόμενο, χωρίς επίβλεψη, ημι-εποπτευόμενο, ή ενίσχυση. Σε καθένα από τα εν λόγω μοντέλα, μπορεί να εφαρμοστεί μία ή περισσότερες αλγοριθμικές τεχνικές – σε σχέση με τα σύνολα δεδομένων που χρησιμοποιούνται και τα επιδιωκόμενα αποτελέσματα. Οι αλγόριθμοι μηχανικής μάθησης είναι βασικά σχεδιασμένοι για να ταξινομούν τα πράγματα, να βρίσκουν μοτίβα, να προβλέπουν τα αποτελέσματα και να λαμβάνουν τεκμηριωμένες αποφάσεις. Οι αλγόριθμοι μπορούν να χρησιμοποιηθούν ένας κάθε φορά ή να συνδυαστούν για να επιτευχθεί η καλύτερη δυνατή ακρίβεια όταν εμπλέκονται σύνθετα και πιο απρόβλεπτα δεδομένα.
Πώς λειτουργεί η διαδικασία μηχανικής μάθησης
Τι είναι η επιβλεπόμενη μάθηση;
Η επιβλεπόμενη μάθηση είναι το πρώτο από τα τέσσερα μοντέλα μηχανικής μάθησης. Στους επιτηρούμενους αλγορίθμους μάθησης, η μηχανή διδάσκεται από το παράδειγμα. Τα επιτηρούμενα μοντέλα μάθησης αποτελούνται από ζεύγη δεδομένων «εισόδου» και «εξόδου», όπου η έξοδος επισημαίνεται με την επιθυμητή τιμή. Για παράδειγμα, ας πούμε ότι ο στόχος είναι η μηχανή να πει τη διαφορά μεταξύ μαργαρίτες και πανσέδες. Ένα δυαδικό ζεύγος δεδομένων εισόδου περιλαμβάνει τόσο μια εικόνα μιας μαργαρίτας όσο και μια εικόνα ενός πανσού. Το επιθυμητό αποτέλεσμα για αυτό το συγκεκριμένο ζεύγος είναι να επιλέξετε την μαργαρίτα, οπότε θα προσδιοριστεί ως το σωστό αποτέλεσμα.
Μέσω ενός αλγορίθμου, το σύστημα συγκεντρώνει όλα αυτά τα δεδομένα εκπαίδευσης με την πάροδο του χρόνου και αρχίζει να καθορίζει συσχετιζόμενες ομοιότητες, διαφορές και άλλα σημεία της λογικής – μέχρι να μπορεί να προβλέψει τις απαντήσεις για τις ερωτήσεις μαργαρίτας ή πανσύ από μόνη της. Είναι το ισοδύναμο να δώσουμε σε ένα παιδί ένα σύνολο προβλημάτων με ένα κλειδί απάντησης, στη συνέχεια να τους ζητήσει να δείξουν τη δουλειά τους και να εξηγήσουν τη λογική τους. Τα επιτηρούμενα μοντέλα μάθησης χρησιμοποιούνται σε πολλές από τις εφαρμογές με τις οποίες αλληλεπιδρούμε καθημερινά, όπως οι μηχανές συστάσεων για προϊόντα και εφαρμογές ανάλυσης κυκλοφορίας, όπως το Waze, το οποίο προβλέπει την ταχύτερη διαδρομή σε διαφορετικές ώρες της ημέρας.
Τι είναι η μη επιβλεπόμενη μάθηση;
Η μη επιβλεπόμενη μάθηση είναι το δεύτερο από τα τέσσερα μοντέλα μηχανικής μάθησης. Σε μοντέλα μάθησης χωρίς επίβλεψη, δεν υπάρχει κλειδί απάντησης. Η μηχανή μελετά τα δεδομένα εισόδου – πολλά από τα οποία είναι αδόμητα και αδόμητα – και αρχίζει να εντοπίζει μοτίβα και συσχετίσεις, χρησιμοποιώντας όλα τα σχετικά, προσβάσιμα δεδομένα. Από πολλές απόψεις, η ανεπίβλεπτη μάθηση βασίζεται στο πώς οι άνθρωποι παρατηρούν τον κόσμο. Χρησιμοποιούμε τη διαίσθηση και την εμπειρία για να ομαδοποιήσουμε τα πράγματα. Καθώς βιώνουμε όλο και περισσότερα παραδείγματα για κάτι, η ικανότητά μας να κατηγοριοποιούμε και να ταυτοποιούμε γίνεται όλο και πιο ακριβής. Για τις μηχανές, η «εμπειρία» ορίζεται από την ποσότητα των δεδομένων που εισάγονται και καθίστανται διαθέσιμα. Κοινά παραδείγματα ανεπίβλεπτων εφαρμογών μάθησης περιλαμβάνουν αναγνώριση προσώπου, ανάλυση γονιδιακών ακολουθιών, έρευνα αγοράς και κυβερνοασφάλεια.
Τι είναι η ημι-επιβλεπόμενη μάθηση;
Η ημι-εποπτευόμενη μάθηση είναι το τρίτο από τέσσερα μοντέλα μηχανικής μάθησης. Σε έναν τέλειο κόσμο, όλα τα δεδομένα θα ήταν δομημένα και επισημασμένα πριν εισαχθούν σε ένα σύστημα. Αλλά δεδομένου ότι αυτό προφανώς δεν είναι εφικτό, η ημι-εποπτευόμενη μάθηση γίνεται μια εφαρμόσιμη λύση όταν υπάρχουν τεράστιες ποσότητες ακατέργαστων, μη δομημένων δεδομένων. Αυτό το μοντέλο αποτελείται από την εισαγωγή μικρών ποσοτήτων δεδομένων με ετικέτα για να αυξήσει τα σύνολα δεδομένων χωρίς ετικέτα. Ουσιαστικά, τα επισημασμένα δεδομένα ενεργούν για να δώσουν μια αρχή λειτουργίας στο σύστημα και μπορούν να βελτιώσουν σημαντικά την ταχύτητα και την ακρίβεια της μάθησης. Ένας ημι-εποπτευόμενος αλγόριθμος μάθησης καθοδηγεί τη μηχανή να αναλύσει τα επισημασμένα δεδομένα για τις συσχετιζόμενες ιδιότητες που θα μπορούσαν να εφαρμοστούν στα δεδομένα χωρίς ετικέτα.
Όπως διερευνήθηκε σε βάθος σε αυτό το ερευνητικό έγγραφο Τύπου του ΜΙΤ, υπάρχουν, ωστόσο, κίνδυνοι που σχετίζονται με αυτό το μοντέλο, όπου τα ελαττώματα στα επισημασμένα δεδομένα μαθαίνονται και αναπαράγονται από το σύστημα. Οι εταιρείες που χρησιμοποιούν με τη μεγαλύτερη επιτυχία ημι-επιβλεπόμενη μάθηση διασφαλίζουν ότι υπάρχουν πρωτόκολλα βέλτιστης πρακτικής. Η ημι-επιβλεπόμενη μάθηση χρησιμοποιείται στην ομιλία και τη γλωσσική ανάλυση, τη σύνθετη ιατρική έρευνα όπως η κατηγοριοποίηση πρωτεϊνών, και την υψηλού επιπέδου ανίχνευση απάτης.
Τι είναι η ενισχυμένη μάθηση;
Η ενισχυμένη μάθηση είναι το τέταρτο μοντέλο μηχανικής μάθησης. Στην επιβλεπόμενη μάθηση, η μηχανή λαμβάνει το κλειδί απάντησης και μαθαίνει βρίσκοντας συσχετίσεις μεταξύ όλων των σωστών αποτελεσμάτων. Το μοντέλο ενισχυμένης μάθησης δεν περιλαμβάνει ένα κλειδί απάντησης αλλά, αντίθετα, εισάγει ένα σύνολο επιτρεπόμενων ενεργειών, κανόνων και πιθανών τελικών καταστάσεων. Όταν ο επιθυμητός στόχος του αλγορίθμου είναι σταθερός ή δυαδικός, οι μηχανές μπορούν να μάθουν με το παράδειγμα. Αλλά σε περιπτώσεις όπου το επιθυμητό αποτέλεσμα είναι μεταβλητό, το σύστημα πρέπει να μάθει από την εμπειρία και την ανταμοιβή. Στα μοντέλα ενισχυτικής μάθησης, η «ανταμοιβή» είναι αριθμητική και προγραμματίζεται στον αλγόριθμο ως κάτι που το σύστημα επιδιώκει να συλλέξει.
Από πολλές απόψεις, αυτό το μοντέλο είναι ανάλογο με τη διδασκαλία κάποιου πώς να παίζει σκάκι. Σίγουρα, θα ήταν αδύνατο να προσπαθήσουμε να τους δείξουμε κάθε πιθανή κίνηση. Αντ ‘αυτού, εξηγείτε τους κανόνες και ενισχύουν τις δεξιότητές τους μέσω της πρακτικής. Οι ανταμοιβές έρχονται με τη μορφή όχι μόνο της νίκης του παιχνιδιού, αλλά και της απόκτησης των κομματιών του αντιπάλου. Οι εφαρμογές της ενισχυμένης μάθησης περιλαμβάνουν αυτοματοποιημένη προσφορά τιμών για τους αγοραστές της διαδικτυακής διαφήμισης, της ανάπτυξης παιχνιδιών υπολογιστών, και της διαπραγμάτευσης χρηματιστηριακών αγορών υψηλών συμμετοχών.
Enterprise machine learning σε ενέργεια
Οι αλγόριθμοι μηχανικής μάθησης αναγνωρίζουν μοτίβα και συσχετίσεις, πράγμα που σημαίνει ότι είναι πολύ καλοί στην ανάλυση της δικής τους επένδυσης. Για εταιρείες που επενδύουν σε τεχνολογίες μηχανικής μάθησης, αυτό το χαρακτηριστικό επιτρέπει μια σχεδόν άμεση αξιολόγηση των λειτουργικών επιπτώσεων. Κατωτέρω είναι ακριβώς ένα μικρό δείγμα μερικών από τους αναπτυσσόμενους τομείς των εφαρμογών εκμάθησης μηχανών επιχειρήσεων.
- Μηχανισμοί σύστασης: Από το 2009 έως το 2017, ο αριθμός των νοικοκυριών των ΗΠΑ που εγγράφονται σε υπηρεσίες ροής βίντεο αυξήθηκε κατά 450%. Και ένα άρθρο του 2020 στο περιοδικό Forbes αναφέρει μια περαιτέρω αύξηση στα στοιχεία χρήσης ροής βίντεο έως και 70%. Οι μηχανές σύστασης έχουν εφαρμογές σε πολλές πλατφόρμες λιανικής πώλησης και αγορών, αλλά σίγουρα έρχονται στις δικές τους με υπηρεσίες συνεχούς ροής μουσικής και βίντεο.
- Δυναμικό μάρκετινγκ: Η δημιουργία πιθανών πελατών και η διοχέτευσή τους μέσω της διοχέτευσης πωλήσεων απαιτεί τη δυνατότητα να συγκεντρωθούν και να αναλυθούν όσο το δυνατόν περισσότερα στοιχεία πελατών. Οι σύγχρονοι καταναλωτές παράγουν έναν τεράστιο όγκο ποικίλων και μη δομημένων δεδομένων – από μεταγραφές συνομιλίας έως μεταφορτώσεις εικόνων. Η χρήση των εφαρμογών μηχανικής μάθησης βοηθά τους εμπόρους να κατανοήσουν αυτά τα δεδομένα – και να τα χρησιμοποιήσουν για να παρέχουν εξατομικευμένο περιεχόμενο μάρκετινγκ και δέσμευση σε πραγματικό χρόνο με τους πελάτες και τους πιθανούς πελάτες.
- ERP και αυτοματοποίηση διαδικασιών: Οι βάσεις δεδομένων ERP περιέχουν ευρεία και διαφορετικά σύνολα δεδομένων, τα οποία μπορεί να περιλαμβάνουν στατιστικά απόδοσης πωλήσεων, αναθεωρήσεις καταναλωτών, αναφορές τάσεων αγοράς και αρχεία διαχείρισης εφοδιαστικής αλυσίδας. Οι αλγόριθμοι μηχανικής μάθησης μπορούν να χρησιμοποιηθούν για την εύρεση συσχετίσεων και προτύπων σε τέτοια δεδομένα. Αυτές οι πληροφορίες μπορούν στη συνέχεια να χρησιμοποιηθούν για την ενημέρωση σχεδόν κάθε τομέα της επιχείρησης, συμπεριλαμβανομένης της βελτιστοποίησης των ροών εργασίας των συσκευών Internet of Things (IoT) εντός του δικτύου ή των καλύτερων τρόπων αυτοματοποίησης επαναλαμβανόμενων εργασιών ή εργασιών επιρρεπών σε σφάλματα.
- Προληπτική συντήρηση: Οι σύγχρονες εφοδιαστικές αλυσίδες και τα έξυπνα εργοστάσια χρησιμοποιούν όλο και περισσότερο συσκευές και μηχανήματα IoT, καθώς και συνδεσιμότητα cloud σε όλους τους στόλους και τις δραστηριότητές τους. Οι βλάβες και οι ανεπάρκειες μπορεί να οδηγήσουν σε τεράστιο κόστος και διαταραχές. Όταν τα δεδομένα συντήρησης και επισκευής συλλέγονται με μη αυτόματο τρόπο, είναι σχεδόν αδύνατο να προβλεφθούν πιθανά προβλήματα – πόσο μάλλον να αυτοματοποιηθούν οι διαδικασίες για την πρόβλεψη και την πρόληψή τους. Οι αισθητήρες πύλης μπορούν να τοποθετηθούν ακόμη και σε αναλογικά μηχανήματα δεκαετιών, παρέχοντας ορατότητα και αποτελεσματικότητα σε όλη την επιχείρηση.
Προκλήσεις μηχανικής μάθησης
Στο βιβλίο του Spurious Corratations, ο επιστήμονας δεδομένων και απόφοιτος του Χάρβαρντ Τάιλερ Βίγκαν επισημαίνει ότι «Δεν είναι όλες οι συσχετίσεις ενδεικτικές μιας υποκείμενης αιτιώδους σύνδεσης». Για να το καταδείξει αυτό, περιλαμβάνει ένα διάγραμμα που δείχνει μια φαινομενικά ισχυρή συσχέτιση μεταξύ της κατανάλωσης μαργαρίνης και του ποσοστού διαζυγίου στην κατάσταση του Μέιν. Φυσικά, αυτό το διάγραμμα έχει σκοπό να κάνει ένα χιουμοριστικό σημείο. Ωστόσο, πιο σοβαρά, οι εφαρμογές μηχανικής μάθησης είναι ευάλωτες τόσο στην ανθρώπινη όσο και στην αλγοριθμική μεροληψία και σφάλμα. Και λόγω της τάσης τους να μάθουν και να προσαρμοστούν, τα λάθη και οι ψευδείς συσχετίσεις μπορούν γρήγορα να διαδώσουν και να μολύνουν τα αποτελέσματα σε όλο το νευρωνικό δίκτυο.
Μια πρόσθετη πρόκληση προέρχεται από μοντέλα μηχανικής μάθησης, όπου ο αλγόριθμος και η έξοδος του είναι τόσο πολύπλοκα που δεν μπορούν να εξηγηθούν ή να κατανοηθούν από τους ανθρώπους. Αυτό ονομάζεται μοντέλο “black box” και θέτει σε κίνδυνο τις εταιρείες όταν δεν είναι σε θέση να προσδιορίσουν πώς και γιατί ένας αλγόριθμος κατέληξε σε ένα συγκεκριμένο συμπέρασμα ή απόφαση.
Ευτυχώς, καθώς αυξάνεται η πολυπλοκότητα των συνόλων δεδομένων και των αλγορίθμων μηχανικής μάθησης, το ίδιο συμβαίνει και με τα εργαλεία και τους πόρους που είναι διαθέσιμοι για τη διαχείριση του κινδύνου. Οι καλύτερες εταιρείες εργάζονται για την εξάλειψη των σφαλμάτων και της μεροληψίας με τη θέσπιση αξιόπιστων και επικαιροποιημένων κατευθυντήριων γραμμών διακυβέρνησης και πρωτοκόλλων βέλτιστης πρακτικής.