Q-learning

Συγγραφέας: Roger Morrison
Ημερομηνία Δημιουργίας: 24 Σεπτέμβριος 2021
Ημερομηνία Ενημέρωσης: 11 Ενδέχεται 2024
Anonim
Q-Learning Explained - A Reinforcement Learning Technique
Βίντεο: Q-Learning Explained - A Reinforcement Learning Technique

Περιεχόμενο

Ορισμός - Τι σημαίνει Q-learning;

Η Q-learning είναι ένας όρος για μια δομή αλγορίθμου που αντιπροσωπεύει την εκμάθηση οπλισμού χωρίς μοντέλα. Αξιολογώντας πολιτική και χρησιμοποιώντας στοχαστική μοντελοποίηση, η Q-learning βρίσκει την καλύτερη πορεία προς τα εμπρός σε μια διαδικασία λήψης αποφάσεων Markov.


Εισαγωγή στη Microsoft Azure και το Microsoft Σε αυτό τον οδηγό θα μάθετε τι είναι το cloud computing και πώς η Microsoft Azure μπορεί να σας βοηθήσει να μεταφέρετε και να εκτελέσετε την επιχείρησή σας από το cloud.

Η Techopedia εξηγεί την Q-learning

Η τεχνική σύνθεση του αλγορίθμου Q-learning περιλαμβάνει έναν παράγοντα, ένα σύνολο κρατών και ένα σύνολο ενεργειών ανά κράτος.

Η λειτουργία Q χρησιμοποιεί βάρη για διάφορα βήματα σε συνδυασμό με έναν συντελεστή προεξόφλησης προκειμένου να αποτιμηθούν οι ανταμοιβές.

Παρόλο που μπορεί να φανεί μια απλή ιδέα, η Q-learning είναι υψίστης σημασίας σε πολλούς τύπους ενισχυτικής μάθησης και μοντέλα βαθιάς μάθησης. Ένα από τα καλύτερα παραδείγματα είναι το σημείο όπου η βαθιά Q-learning χρησιμοποιείται για να βοηθήσει τα προγράμματα εκμάθησης μηχανών να μάθουν στρατηγικές παιχνιδιού σε διάφορα είδη βιντεοπαιχνιδιών, για παράδειγμα, σε παιχνίδια Atari από τη δεκαετία του '80. Εδώ ένα συνελικτικό νευρωνικό δίκτυο παίρνει δείγματα παιχνιδιού-παιχνιδιού για να επεξεργαστεί ένα στοχαστικό μοντέλο που θα βοηθήσει τον υπολογιστή να ξέρει πώς να παίξει καλύτερα το παιχνίδι με την πάροδο του χρόνου.


Η Q-learning έχει άφθονες δυνατότητες για να βοηθήσει στην προώθηση της τεχνητής νοημοσύνης και της μηχανικής μάθησης.