Μια περιήγηση σε μοντέλα βαθιάς μάθησης

Βίντεο: ΠΕΡΙΗΓΗΣΗ ΣΤΗ ΣΥΓΧΡΟΝΗ ΚΟΣΜΟΛΟΓΙΑ / A TOUR IN MODERN COSMOLOGY (Subtitled)

Περιεχόμενο

Νευρωνικό στυλ
Νευρωνικός κατακτητής
Δεδομένα
Char-RNN TED
συμπέρασμα

Πηγή: Kran77 / Dreamstime.com

Πάρε μακριά:

Τα μοντέλα βαθιάς μάθησης διδάσκουν τους υπολογιστές να σκέφτονται μόνοι τους, με κάποια πολύ διασκεδαστικά και ενδιαφέροντα αποτελέσματα.

Η βαθιά εκμάθηση εφαρμόζεται σε όλο και περισσότερους τομείς και βιομηχανίες. Από τα αυτοκίνητα χωρίς οδηγό, μέχρι το Go, στη δημιουργία μουσικής με εικόνες, υπάρχουν νέα μοντέλα βαθιάς μάθησης που εξέρχονται καθημερινά. Εδώ πηγαίνουμε σε πολλά δημοφιλή μοντέλα βαθιάς μάθησης. Οι επιστήμονες και οι προγραμματιστές λαμβάνουν αυτά τα μοντέλα και τα τροποποιούν με νέους και δημιουργικούς τρόπους. Ελπίζουμε ότι αυτή η βιτρίνα μπορεί να σας εμπνεύσει για να δείτε τι είναι δυνατό. (Για να μάθετε για τις εξελίξεις στην τεχνητή νοημοσύνη, βλ. Will Computers μπορεί να μιμηθεί τον ανθρώπινο εγκέφαλο;)

Νευρωνικό στυλ

Δεν μπορείτε να βελτιώσετε τις δεξιότητες προγραμματισμού σας όταν κανείς δεν ενδιαφέρεται για την ποιότητα του λογισμικού.

Νευρωνικός κατακτητής

Το Neural Storyteller είναι ένα μοντέλο που, όταν δοθεί μια εικόνα, μπορεί να δημιουργήσει μια ιστορία ειδύλλιο για την εικόνα. Είναι ένα διασκεδαστικό παιχνίδι και παρόλα αυτά μπορείτε να φανταστείτε το μέλλον και να δείτε την κατεύθυνση στην οποία κινούνται όλα αυτά τα μοντέλα τεχνητής νοημοσύνης.

Η παραπάνω λειτουργία είναι η λειτουργία "στυλ μετατόπισης" που επιτρέπει στο μοντέλο να μεταφέρει τυπικές λεζάντες εικόνας στο ύφος ιστοριών από μυθιστορήματα. Η μετατόπιση του ύφους εμπνεύστηκε από έναν "Νευρικό Αλγόριθμο Καλλιτεχνικού Στυλ".

Δεδομένα

Υπάρχουν δύο κύριες πηγές δεδομένων που χρησιμοποιούνται σε αυτό το μοντέλο. Το MSCOCO είναι ένα σύνολο δεδομένων από τη Microsoft που περιέχει περίπου 300.000 εικόνες, με κάθε εικόνα να περιέχει πέντε υπότιτλους. Το MSCOCO είναι τα μόνα υπό επίβλεψη δεδομένα που χρησιμοποιούνται, πράγμα που σημαίνει ότι είναι τα μόνα δεδομένα στα οποία οι άνθρωποι έπρεπε να εισέλθουν και να γράψουν ρητά λεζάντες για κάθε εικόνα.

Ένας από τους σημαντικότερους περιορισμούς ενός νευρωνικού δικτύου τροφοδοσίας είναι ότι δεν έχει μνήμη. Κάθε πρόβλεψη είναι ανεξάρτητη από τους προηγούμενους υπολογισμούς, σαν να ήταν η πρώτη και μοναδική πρόβλεψη του δικτύου που έγινε ποτέ. Αλλά για πολλές εργασίες, όπως η μετάφραση μιας πρότασης ή μιας παραγράφου, οι εισροές πρέπει να αποτελούνται από διαδοχικά και συνολικά συναφή δεδομένα. Για παράδειγμα, θα ήταν δύσκολο να κατανοήσουμε μια λέξη σε μια φράση χωρίς το con που παρέχεται από τις γύρω λέξεις.

Τα RNNs είναι διαφορετικά επειδή προσθέτουν ένα άλλο σύνολο συνδέσεων μεταξύ των νευρώνων. Αυτοί οι σύνδεσμοι επιτρέπουν την ενεργοποίηση των ενεργοποιήσεων από τους νευρώνες σε ένα κρυφό στρώμα στον εαυτό τους στο επόμενο βήμα της ακολουθίας. Με άλλα λόγια, σε κάθε βήμα, ένα κρυφό στρώμα λαμβάνει τόσο την ενεργοποίηση από το επίπεδο κάτω από αυτό όσο και από το προηγούμενο βήμα της ακολουθίας. Αυτή η δομή δίνει ουσιαστικά μνήμη επαναλαμβανόμενων νευρικών δικτύων. Έτσι, για το σκοπό της ανίχνευσης αντικειμένων, ένας RNN μπορεί να αντλήσει από τις προηγούμενες ταξινομήσεις σκυλιών για να βοηθήσει να προσδιορίσει εάν η τρέχουσα εικόνα είναι σκύλος.

Char-RNN TED

Αυτή η ευέλικτη δομή στο κρυφό επίπεδο επιτρέπει στα RNNs να είναι πολύ καλά για μοντέλα γλώσσας σε επίπεδο χαρακτήρα. Το Char RNN, που δημιουργήθηκε αρχικά από τον Andrej Karpathy, είναι ένα μοντέλο που λαμβάνει ένα αρχείο ως είσοδο και εκπαιδεύει έναν RNN για να μάθει να προβλέπει τον επόμενο χαρακτήρα σε μια ακολουθία. Το RNN μπορεί να δημιουργήσει χαρακτήρα από χαρακτήρα που θα μοιάζει με τα αρχικά δεδομένα εκπαίδευσης. Ένα demo έχει εκπαιδευτεί χρησιμοποιώντας μεταγραφές των διαφόρων TED Talks. Τροφοδοτήστε το μοντέλο με μία ή περισσότερες λέξεις-κλειδιά και θα δημιουργήσει ένα πέρασμα σχετικά με τη λέξη (-ες) στη φωνή / στυλ μιας TED Talk.

συμπέρασμα

Αυτά τα μοντέλα δείχνουν νέες ανακαλύψεις στη μηχανική νοημοσύνη που κατέστη δυνατή λόγω της βαθιάς μάθησης. Η βαθιά εκμάθηση δείχνει ότι μπορούμε να λύσουμε προβλήματα που δεν μπορούσαμε να λύσουμε ποτέ πριν και δεν έχουμε φτάσει στο οροπέδιο. Αναμείνετε να δείτε πολλά ακόμα συναρπαστικά πράγματα, όπως τα αυτοκίνητα χωρίς οδηγό, τα επόμενα δύο χρόνια, ως αποτέλεσμα της καινοτομίας της βαθιάς μάθησης.