Επιστήμη δεδομένων ή εκμάθηση μηχανών; Πώς να εντοπίσετε τη διαφορά

Συγγραφέας: Laura McKinney
Ημερομηνία Δημιουργίας: 3 Απρίλιος 2021
Ημερομηνία Ενημέρωσης: 1 Ιούλιος 2024
Anonim
Επιστήμη δεδομένων ή εκμάθηση μηχανών; Πώς να εντοπίσετε τη διαφορά - Τεχνολογία
Επιστήμη δεδομένων ή εκμάθηση μηχανών; Πώς να εντοπίσετε τη διαφορά - Τεχνολογία

Περιεχόμενο


Πηγή: Elnur / Dreamstime.com

Πάρε μακριά:

Η επιστήμη των δεδομένων και η εκμάθηση μηχανών διαφέρουν σε βασικούς τρόπους. Κατά κάποιο τρόπο, μπορεί κανείς να θεωρηθεί ως ένα υποσύνολο του άλλου. Και οι δύο είναι σημαντικές στην τρέχουσα τεχνολογική πρόοδο.

Σε αυτόν τον νέο κόσμο της τεχνητής νοημοσύνης και της διαχείρισης δεδομένων, είναι εύκολο να συγχέεται με ορισμένους από τους όρους που χρησιμοποιούνται πιο συχνά στον κόσμο της πληροφορικής.

Για παράδειγμα, η επιστήμη των δεδομένων και η μηχανική μάθηση έχουν πολλά να κάνουν μεταξύ τους. Δεν προκαλεί έκπληξη το γεγονός ότι πολλοί άνθρωποι με μόνο μια μακρόχρονη γνώση αυτών των κλάδων θα δυσκολευτούν να υπολογίσουν πώς διαφέρουν μεταξύ τους.

Εδώ είναι ο καλύτερος τρόπος να διαχωριστεί η επιστήμη των δεδομένων από τη μηχανική μάθηση, ως αρχή και ως τεχνολογική προσέγγιση.

Επιστήμη των δεδομένων και μάθηση μηχανών: ευρεία και στενή ορολογία

Πρώτον, η επιστήμη των δεδομένων είναι μια ευρεία, γενική κατηγορία τεχνολογίας που περιλαμβάνει πολλούς διαφορετικούς τύπους έργων και δημιουργιών. (Για περισσότερες πληροφορίες σχετικά με τις εργασίες που σχετίζονται με μια επιστήμη δεδομένων, δείτε το Ρόλος εργασίας: Data Scientist.)


Η επιστήμη των δεδομένων είναι ουσιαστικά η πρακτική της εργασίας με μεγάλα δεδομένα. Εμφανίστηκε ως νόμος του Moore και ο πολλαπλασιασμός αποτελεσματικότερων συσκευών αποθήκευσης οδήγησε σε τεράστιες ποσότητες δεδομένων που συλλέχθηκαν από εταιρείες και άλλα μέρη. Στη συνέχεια, μεγάλες πλατφόρμες δεδομένων και εργαλεία όπως ο Hadoop άρχισαν να επαναπροσδιορίζουν τον υπολογισμό μεταβάλλοντας τον τρόπο διαχείρισης των δεδομένων. Τώρα, με σύννεφο και εμπορευματοποίηση καθώς και ολοκαίνουργια μοντέλα, τα μεγάλα δεδομένα έχουν γίνει μια σημαντική κινητήρια δύναμη των τρόπων που εργαζόμαστε και ζούμε.

Στην απλούστερη μορφή της, η επιστήμη των δεδομένων είναι ο τρόπος με τον οποίο διαχειριζόμαστε αυτά τα δεδομένα, από τον καθαρισμό και τη διύλιση, έως τη χρησιμοποίησή της με τη μορφή γνώσεων.

Ο ορισμός της μηχανικής μάθησης είναι πολύ στενότερος. Στη μηχανική μάθηση, οι τεχνολογίες παίρνουν δεδομένα και τα βάζουν μέσω αλγορίθμων, προκειμένου να προσομοιώσουν τις ανθρώπινες γνωστικές διαδικασίες που περιγράφονται ως "μάθηση". Με άλλα λόγια, έχοντας λάβει τα δεδομένα και εκπαιδεύσει σε αυτό, ο υπολογιστής είναι σε θέση να παρέχει τα δικά του αποτελέσματα , όπου η τεχνολογία φαίνεται να έχει μάθει από τις διαδικασίες που εφαρμόζουν οι προγραμματιστές.


Επιστήμη των δεδομένων και μαθήματα δεξιοτήτων μάθησης μηχανών

Ένας άλλος τρόπος να αντιπαραβληθεί η επιστήμη των δεδομένων και η μηχανική μάθηση είναι να εξετάσουμε τις διαφορετικές δεξιότητες που είναι πολύτιμες για τους επαγγελματίες σε καθέναν από αυτούς τους τομείς.

No Bugs, No Stress - Ο οδηγός σας βήμα προς βήμα για τη δημιουργία λογισμικού που αλλάζει τη ζωή χωρίς να καταστρέφει τη ζωή σας

Δεν μπορείτε να βελτιώσετε τις δεξιότητες προγραμματισμού σας όταν κανείς δεν ενδιαφέρεται για την ποιότητα του λογισμικού.

Υπάρχει μια γενική συναίνεση ότι οι επιστήμονες δεδομένων επωφελούνται από βαθιές δεξιότητες αναλυτικής και μαθηματικής, πρακτική εμπειρία με τεχνολογίες βάσεων δεδομένων και γνώση γλωσσών προγραμματισμού όπως η Python ή άλλων πακέτων που χρησιμοποιούνται για την ανάλυση μεγάλων δεδομένων.

"Όποιος ενδιαφέρεται να οικοδομήσει μια ισχυρή καριέρα στην επιστήμη των δεδομένων θα πρέπει να αποκτήσει βασικές δεξιότητες σε τρία τμήματα: την ανάλυση, τον προγραμματισμό και την γνώση του τομέα", γράφει ο Srihari Sasikumar στο Simplilearn. "Με ένα επίπεδο βαθύτερο, οι παρακάτω δεξιότητες θα σας βοηθήσουν να χαράξετε μια εξειδίκευση ως επιστήμονας δεδομένων: Ισχυρή γνώση των Python, SAS, R (και) Scala, πρακτική εμπειρία στην κωδικοποίηση βάσεων δεδομένων SQL, ικανότητα εργασίας με μη δομημένα δεδομένα από διάφορες πηγές όπως το βίντεο και τα κοινωνικά μέσα ενημέρωσης, κατανοούν πολλαπλές αναλυτικές λειτουργίες (και) γνώση της μηχανικής μάθησης. "

Στην πλευρά της μάθησης μηχανών, οι ειδικοί συχνά αναφέρουν τις δεξιότητες μοντελοποίησης δεδομένων, τις πιθανότητες και τις στατιστικές γνώσεις και τις ευρύτερες δεξιότητες προγραμματισμού ως χρήσιμα εργαλεία στο σύνολο εργαλειομηχανών της μηχανής μάθησης.

Πώς να κάνετε Spot Machine Learning

Το κλειδί εδώ είναι ότι όλα τα πράγματα περιλαμβάνουν εργασίες επιστήμης των δεδομένων, αλλά δεν είναι μηχανική μάθηση εκτός αν έχετε ένα πολύ αυστηρό σχήμα που έχει ρυθμιστεί για να βοηθήσει τον υπολογιστή να μάθει από τις εισόδους του.

Όταν συμβαίνει αυτό, δημιουργεί κάποια εκπληκτικά ικανά συστήματα που μπορούν να έχουν ευρείες επιπτώσεις στη ζωή μας.

"Πολλά από αυτά που κάνουμε με τη μηχανική μάθηση συμβαίνουν κάτω από την επιφάνεια", δήλωσε ο ιδρυτής του Amazon Jeff Bezos, επισημαίνοντας ορισμένες από τις εφαρμογές αυτών των τύπων συστημάτων. "Η μηχανική μάθηση οδηγεί τους αλγόριθμούς μας για την πρόβλεψη της ζήτησης, την κατάταξη αναζήτησης προϊόντων, τις προτάσεις προϊόντων και προσφορών, τις τοποθετήσεις στο εμπόριο, την ανίχνευση απάτης, τις μεταφράσεις και πολλά άλλα. Αν και λιγότερο ορατό, μεγάλο μέρος των επιπτώσεων της μηχανικής μάθησης θα είναι αυτού του τύπου - η ήρεμη αλλά ουσιαστικά βελτίωση των βασικών λειτουργιών. "

Ένα από τα πιο χρήσιμα παραδείγματα είναι η εμφάνιση του νευρικού δικτύου - είναι μια κοινή και δημοφιλής μέθοδος δημιουργίας διαδικασιών μηχανικής μάθησης.

Στην πιο βασική της μορφή, το νευρικό δίκτυο αποτελείται από στρώματα τεχνητών νευρώνων. Κάθε μεμονωμένος τεχνητός νευρώνας έχει λειτουργικότητα ισοδύναμη με βιολογικό νευρώνα - αλλά αντί για συνάψεις και δενδρίτες, έχει εισόδους, λειτουργία ενεργοποίησης και τελικές εξόδους.

Το νευρωνικό δίκτυο γίνεται για να δράσει σαν ανθρώπινος εγκέφαλος και οι επαγγελματίες της μηχανικής μάθησης συχνά χρησιμοποιούν αυτό το μοντέλο για να δημιουργήσουν αποτελέσματα μηχανικής μάθησης.

Ωστόσο, αυτός δεν είναι ο μόνος τρόπος για να κάνετε μηχανική μάθηση. Ορισμένα πιο στοιχειώδη προγράμματα εκμάθησης μηχανών περιλαμβάνουν απλώς την εμφάνιση ενός υπολογιστή σε μια ευρεία γκάμα φωτογραφιών (ή την παροχή με άλλα ανεπεξέργαστα δεδομένα), την εισαγωγή ιδεών μέσω της διαδικασίας χρήσης της εποπτευόμενης εκμάθησης μηχανών και των δεδομένων ετικετών και την τελική δυνατότητα του υπολογιστή να κάνει διακρίσεις μεταξύ διάφορα σχήματα ή αντικείμενα σε οπτικό πεδίο. (Για τα βασικά στοιχεία της εκμάθησης μηχανών, ελέγξτε το Machine Learning 101.)

Δύο τελεστές κοπής

Εν κατακλείδι, η μηχανική μάθηση αποτελεί πολύτιμο κομμάτι της επιστήμης των δεδομένων. Αλλά η επιστήμη των δεδομένων αντιπροσωπεύει τα μεγαλύτερα σύνορα και το con στο οποίο λαμβάνει χώρα η μηχανική μάθηση.

Κάπως, θα μπορούσατε να πείτε ότι η μηχανική μάθηση δεν θα συνέβαινε ποτέ χωρίς μεγάλα δεδομένα. Τα ίδια τα μεγάλα δεδομένα δεν δημιούργησαν μηχανική μάθηση - αντίθετα, αφού συλλέξαμε τόσα πολλά στοιχεία που σχεδόν δεν ήξεραμε τι να κάνουμε με αυτό, τα κορυφαία μυαλά ήρθαν με αυτές τις διαδικασίες βιο-προσομοίωσης ως υπερφορτωμένο τρόπο για την παροχή πληροφοριών.

Ένα άλλο καλό πράγμα που πρέπει να θυμόμαστε εδώ είναι ότι η επιστήμη των δεδομένων μπορεί να εφαρμοστεί με δύο βασικούς τρόπους - μπορούμε να αγκαλιάσουμε τη μηχανική μάθηση και την τεχνητή νοημοσύνη, να αφήσουμε τους υπολογιστές να σκεφτούν για εμάς ή να επιστρέψουμε την επιστήμη των δεδομένων σε μια πιο ανθρωποκεντρική προσέγγιση ο υπολογιστής απλώς παρουσιάζει αποτελέσματα και εμείς ως άνθρωποι κάνουμε τις αποφάσεις.

Αυτό οδηγεί μερικούς εμπειρογνώμονες, μεταξύ των οποίων μερικοί από τους κορυφαίους πρωτοπόρους του σήμερα, να ζητήσουν μια πιο ζωντανή καταγραφή των τρόπων με τους οποίους χρησιμοποιούμε αυτές τις τεχνολογίες.

"(AI) είναι σε θέση πολύ περισσότερο από σχεδόν ο καθένας να γνωρίζει και ο ρυθμός βελτίωσης είναι εκθετικός", ανέφερε ο Elon Musk, ενώ προειδοποιεί ότι τα προγράμματα μηχανικής μάθησης και AI απαιτούν επίβλεψη.

Εν πάση περιπτώσει, τόσο η επιστήμη των δεδομένων όσο και η μηχανική μάθηση είναι βασικά μέρη της προόδου που επιτελούμε σήμερα ως κοινωνίες στην τεχνολογία.