Ενίσχυση της μάθησης

Βίντεο: Συζήτηση: Η συνεισφορά των ψηφιακών εργαλείων στην ενίσχυση της μάθησης και της διδασκαλίας

Περιεχόμενο

Ορισμός - Τι σημαίνει Ενίσχυση Learning;
Εισαγωγή στη Microsoft Azure και το Microsoft Σε αυτό τον οδηγό θα μάθετε τι είναι το cloud computing και πώς η Microsoft Azure μπορεί να σας βοηθήσει να μεταφέρετε και να εκτελέσετε την επιχείρησή σας από το cloud.
Η Techopedia εξηγεί την ενίσχυση της μάθησης

Ορισμός - Τι σημαίνει Ενίσχυση Learning;

Η ενίσχυση της μάθησης, στο κώλο της τεχνητής νοημοσύνης, είναι ένας τύπος δυναμικού προγραμματισμού που εκπαιδεύει αλγορίθμους χρησιμοποιώντας ένα σύστημα ανταμοιβής και τιμωρίας.

Ένας αλγόριθμος μάθησης οπλισμού, ή ένας πράκτορας, μαθαίνει αλληλεπιδρώντας με το περιβάλλον του. Ο πράκτορας λαμβάνει ανταμοιβές με την ορθή εκτέλεση και κυρώσεις για την εσφαλμένη εκτέλεση. Ο πράκτορας μαθαίνει χωρίς παρέμβαση από έναν άνθρωπο μεγιστοποιώντας την ανταμοιβή του και ελαχιστοποιώντας την ποινή του.

Εισαγωγή στη Microsoft Azure και το Microsoft Σε αυτό τον οδηγό θα μάθετε τι είναι το cloud computing και πώς η Microsoft Azure μπορεί να σας βοηθήσει να μεταφέρετε και να εκτελέσετε την επιχείρησή σας από το cloud.

Η Techopedia εξηγεί την ενίσχυση της μάθησης

Η ενίσχυση της μάθησης είναι μια προσέγγιση της μηχανικής μάθησης που εμπνέεται από τη συμπεριφοριστική ψυχολογία. Είναι παρόμοιο με το πώς ένα παιδί μαθαίνει να εκτελεί μια νέα εργασία. Η ενίσχυση της μάθησης έρχεται σε αντίθεση με άλλες προσεγγίσεις μηχανικής μάθησης, επειδή ο αλγόριθμος δεν λέει ρητά πώς να εκτελέσει μια εργασία, αλλά εργάζεται μέσω του προβλήματος από μόνο του.

Ως πράκτορας, που μπορεί να είναι αυτοκινούμενο αυτοκίνητο ή πρόγραμμα που παίζει σκάκι, αλληλεπιδρά με το περιβάλλον του, λαμβάνει μια κατάσταση ανταμοιβής ανάλογα με τον τρόπο που εκτελεί, όπως η οδήγηση στον προορισμό με ασφάλεια ή η κατάκτηση ενός παιχνιδιού. Αντίστροφα, ο πράκτορας λαμβάνει ποινή για την εσφαλμένη εκτέλεση, όπως η έξοδος από το δρόμο ή το checkmating.

Ο πράκτορας με την πάροδο του χρόνου λαμβάνει αποφάσεις για να μεγιστοποιήσει την ανταμοιβή του και να ελαχιστοποιήσει την ποινή του χρησιμοποιώντας δυναμικό προγραμματισμό Το πλεονέκτημα αυτής της προσέγγισης στην τεχνητή νοημοσύνη είναι ότι επιτρέπει σε ένα πρόγραμμα AI να μάθει χωρίς προγραμματιστή να εξηγεί πώς ένας πράκτορας πρέπει να εκτελέσει το έργο.