AlphaGo

Συγγραφέας: Louise Ward
Ημερομηνία Δημιουργίας: 5 Φεβρουάριος 2021
Ημερομηνία Ενημέρωσης: 28 Ιούνιος 2024
Anonim
AlphaGo - The Movie | Full award-winning documentary
Βίντεο: AlphaGo - The Movie | Full award-winning documentary

Περιεχόμενο

Ορισμός - Τι σημαίνει AlphaGo;

Το AlphaGo είναι ένα στενό AI, ένα πρόγραμμα υπολογιστή που αναπτύχθηκε από το Google DeepMind για να παίξει Go, ένα κινεζικό παιχνίδι στρατηγικής για δύο παίκτες παρόμοιο με το σκάκι. Το AlphaGo είναι το πρώτο πρόγραμμα AI που κατάφερε να κερδίσει τον Οκτώβρη του 2015 έναν επαγγελματία παίκτη, τον παίκτη 2-dan Fan Hui, σε ένα πλήρες πακέτο χωρίς χέρια. Έπειτα, τον Μάρτιο του 2016, κέρδισε έναν από τους κορυφαίους παίκτες στον κόσμο, 9-dan Lee Sedol, κερδίζοντας τέσσερα παιχνίδια από τα πέντε.


Εισαγωγή στη Microsoft Azure και το Microsoft Σε αυτό τον οδηγό θα μάθετε τι είναι το cloud computing και πώς η Microsoft Azure μπορεί να σας βοηθήσει να μεταφέρετε και να εκτελέσετε την επιχείρησή σας από το cloud.

Η Techopedia εξηγεί το AlphaGo

Το έργο AlphaGo ξεκίνησε το 2014 ως δοκιμαστικό κρεβάτι για να δούμε πόσο καλά ο αλγόριθμος Google DeepMinds για το νευρικό δίκτυο που χρησιμοποιεί τη βαθιά μάθηση θα μπορούσε να ανταγωνιστεί το Go. Ο αλγόριθμος για το AlphaGo είναι ένας συνδυασμός τεχνικών αναζήτησης δέντρων και μηχανικής μάθησης και ενισχύεται με εκτεταμένη εκπαίδευση τόσο με ανθρώπους όσο και με άλλους παίκτες υπολογιστών. Χρησιμοποιεί την αναζήτηση δέντρου Monte Carlo και καθοδηγείται από ένα δίκτυο πολιτικής και αξίας, το οποίο υλοποιείται χρησιμοποιώντας τεχνολογίες βαθιάς νευρωνικού δικτύου. Το δίκτυο πολιτικής εκπαιδεύεται και βοηθά το AI να προβλέψει την επόμενη κίνηση που πιθανότατα θα κερδίσει, ενώ το δίκτυο αξίας εκπαιδεύεται για να περιορίσει το δέντρο αναζήτησης και να καθορίσει την αξία αυτών των θέσεων, εκτιμώντας τους νικητές σε κάθε θέση αντί να ψάχνει προς τα κάτω μέχρι το τέλος του παιχνιδιού.


Το AlphaGo τροφοδοτήθηκε για πρώτη φορά με ιστορικές κινήσεις αγώνα από ανθρώπους, χρησιμοποιώντας μια βάση δεδομένων περίπου 30 εκατομμυρίων κινήσεων, γεγονός που το κάνει να μιμείται ανθρώπινα παιχνίδια. Μόλις το AI έφτασε σε ένα βαθμό επάρκειας, εκπαιδεύτηκε περαιτέρω, καθιστώντας το να παίζει εναντίον των περιπτώσεων του εαυτού του, χρησιμοποιώντας την ενίσχυση της μάθησης για να βελτιώσει και να μάθει περισσότερα.

Τον Οκτώβριο του 2015, μια κατανεμημένη υπολογιστική έκδοση του AlphaGo έπαιξε και νίκησε τον Fan Hui, έναν 2-dan European Go Champion, σηματοδοτώντας για πρώτη φορά ότι ένα πρόγραμμα ηλεκτρονικών υπολογιστών είχε κερδίσει έναν επαγγελματία παίκτη στο Go. Ο Fan Hui βοήθησε ως σύμβουλος της ομάδας DeepMind μήνες μετά την ήττα του. Τον Μάρτιο του 2016, η AlphaGo προχώρησε εναντίον του Lee Sedol, ενός από τους κορυφαίους παίκτες στον κόσμο, έχοντας επιτύχει το κορυφαίο επίπεδο του 9-dan. Κερδίζοντας τέσσερα παιχνίδια στον Lees ένα, αυτό σηματοδότησε μια σημαντική ανακάλυψη στην έρευνα AI, καθώς αυτό σήμαινε ότι ο αλγόριθμος βαθιάς μάθησης και νευρωνικών δικτύων που χρησιμοποιείται από το DeepMind μπορεί να χρησιμοποιηθεί για οποιονδήποτε άλλο σκοπό αφού δεν ήταν πραγματικά προγραμματισμένος να παίζει Go, αλλά μάλλον διδάχθηκε πώς να παίξετε Go. Αυτό ανοίγει έναν εντελώς νέο κόσμο για την έρευνα AI.