Κολλέγιο Grades Χρειάζεστε αυτές τις δεξιότητες Data Science

Συγγραφέας: Laura McKinney
Ημερομηνία Δημιουργίας: 4 Απρίλιος 2021
Ημερομηνία Ενημέρωσης: 16 Ενδέχεται 2024
Anonim
The Great Gildersleeve: Gildy’s New Car / Leroy Has the Flu / Gildy Needs a Hobby
Βίντεο: The Great Gildersleeve: Gildy’s New Car / Leroy Has the Flu / Gildy Needs a Hobby

Περιεχόμενο


Πηγή: Maxkabakov / Dreamstime.com

Πάρε μακριά:

Ο τεχνολογικός κόσμος ταξιδεύει με ταχείς ρυθμούς και ακόμη και νέοι πτυχιούχοι μπορεί να μην έχουν μάθει όλες τις δεξιότητες που χρειάζονται για μια καριέρα. Αναθεωρούμε τις κορυφαίες δεξιότητες και συζητούμε πώς να τις αποκτήσουμε.

Ανάλογα με τον κύριό σας, όταν αποφοιτήσετε από το κολέγιο, μπορεί να χρειαστεί να μάθετε επιπλέον δεξιότητες για να είστε πιο εμπορεύσιμοι. Και σύμφωνα με το LinkedIn, οι τρεις πρώτες δεξιότητες που μαθαίνουν οι νέοι πτυχιούχοι τους έξι μήνες μετά την αποφοίτηση είναι η οπτικοποίηση δεδομένων, η μοντελοποίηση δεδομένων και η Python.

"Το 2020, ο κόσμος θα δημιουργήσει 50 φορές το ποσό των δεδομένων που έκανε το 2011", δήλωσε ο Derek Steer, Διευθύνων Σύμβουλος της Mode, μια πλατφόρμα ανάλυσης δεδομένων. Η ισχύς επεξεργασίας δεδομένων είναι πλέον φθηνή και προσβάσιμη σε σχεδόν κάθε εταιρεία, και ο Steer λέει ότι η πραγματική συμφόρηση είναι η εξεύρεση ανθρώπων με τις σωστές δεξιότητες.


Ωστόσο, οι εταιρείες διευρύνουν τον ορισμό του ατόμου που θα πρέπει να έχει τις δεξιότητες για να κατανοεί και να χειρίζεται δεδομένα.

"Μέχρι πρόσφατα, ο ρόλος της προγνωστικής ανάλυσης μειώθηκε κυρίως σε πεπειραμένους επιστήμονες επιστήμης δεδομένων, ενώ η επεξεργασία φυσικών γλωσσών ή η δημιουργία εξελιγμένων μοντέλων δεδομένων προορίζονταν για επαγγελματίες με ισχυρά τεχνικά υπόβαθρα", δήλωσε ο Χάρι Γκλάνσερ, πρόεδρος της επιχείρησης δεδομένων στο Sisense, η οποία παρέχει εργαλεία για να βοηθήσει τους επαγγελματίες των δεδομένων να δημιουργούν αναλυτικές εφαρμογές. "Ωστόσο, η πίεση της αγοράς έχει αναγκάσει μια μελλοντοστραφή ανάλυση να αποτελεί τακτικό μέρος των επιχειρηματικών δραστηριοτήτων".

Και ο Glaser λέει ότι αυτό απαιτεί πιο προηγμένα σύνολα δεξιοτήτων. "Αυτό σημαίνει μεγάλες αλλαγές και νέες απαιτήσεις, που σημαίνει κατανόηση περισσότερων γλωσσών χειρισμού δεδομένων που χρησιμοποιούνται συχνά για προηγμένες αναλύσεις, όπως η Python και η R."


Ας εξετάσουμε αυτές τις δεξιότητες, γιατί είναι σημαντικές και πώς μπορούν να τα μάθουν νέα βαθμίδες - ή οποιοσδήποτε -.

Οπτικοποίηση δεδομένων

Η οπτικοποίηση δεδομένων είναι η κορυφαία ικανότητα που αναγράφεται από το LinkedIn, αλλά τι είναι αυτό; "Η οπτικοποίηση δεδομένων μετατρέπει τα δεδομένα σε γραφικές αναπαραστάσεις, όπως γραφήματα και άλλα πιο οπτικά ελκυστικά φορμά, προκειμένου να παράσχει έναν αποτελεσματικό τρόπο ερμηνείας και κατανόησης ενός συνόλου δεδομένων", λέει ο Roberto Reif, εκτελεστικός διευθυντής της επιστήμης των δεδομένων στο Metis, προγράμματα κατάρτισης των επιστημών δεδομένων.

Για παράδειγμα, η μετατροπή των αριθμών από ένα υπολογιστικό φύλλο σε μια σειρά γραμμών ή πινακίδων πίτας, καθιστά ευκολότερη την πέψη. "Ο στόχος της απεικόνισης των δεδομένων είναι να μετατρέψουν τα σύνολα πληροφοριών σε αποτελεσματική οπτική αφήγηση και να παρέχουν ιδέες με τέτοιο τρόπο ώστε το κοινό σας να μπορεί να καταλάβει", λέει ο Reif.

No Bugs, No Stress - Ο οδηγός σας βήμα προς βήμα για τη δημιουργία λογισμικού που αλλάζει τη ζωή χωρίς να καταστρέφει τη ζωή σας

Δεν μπορείτε να βελτιώσετε τις δεξιότητες προγραμματισμού σας όταν κανείς δεν ενδιαφέρεται για την ποιότητα του λογισμικού.

Και είναι μια δεξιότητα κατά ζήτηση για διάφορους λόγους. "Η απεικόνιση των δεδομένων δεν διδάσκεται ευρέως στο σχολείο, έτσι ώστε τα νέα γήπεδα με αυτές τις δεξιότητες να ξεχωρίζουν από το πλήθος", σύμφωνα με τον Yi Zou, ο οποίος είναι ο ανώτερος διευθυντής της μηχανικής και διαχειρίζεται τις ομάδες μηχανικών παραγωγής προϊόντων επιστήμης δεδομένων στην ASML Silicon Valley. "Το πιο σημαντικό, η καλή οπτικοποίηση των δεδομένων επιτρέπει καλύτερες γνώσεις, οδηγώντας σε καλύτερες αποφάσεις, ειδικά στη φάση εξερεύνησης".

Και υπάρχει ακόμα ένας λόγος για τον οποίο αυτή η ικανότητα είναι σε μεγάλη ζήτηση. "Οι εργαζόμενοι που είναι σε θέση να πουν συναρπαστικές ιστορίες με γραφήματα και γραφήματα υψηλής ποιότητας είναι συνήθως πιο αποτελεσματικά στην σαφή επικοινωνία των ευρημάτων τους", λέει ο Ζου. (Για να μάθετε περισσότερα, ανατρέξτε στη Χαρά των Δεδομένων Βλέπε: Τα δεδομένα που δεν αναζητούσατε.)

Μοντελοποίηση δεδομένων

Σύμφωνα με το LinkedIn, η μοντελοποίηση δεδομένων είναι η δεύτερη πιο δημοφιλής ικανότητα που οι πρόσφατες βαθμίδες επενδύουν στη μάθηση. "Η μοντελοποίηση δεδομένων αφορά μόνο την κατανόηση και τη χρήση δεδομένων για την εύρεση σχέσεων μεταξύ διαφορετικών συνόλων πληροφοριών" εξηγεί ο Reif.

Για παράδειγμα, αν σκοπεύετε να βάλετε το σπίτι σας στην αγορά και προσπαθείτε να προβλέψετε την τιμή πώλησης, λέει ότι πρέπει να εξετάσετε μια σειρά δεδομένων, όπως τετραγωνικά μέτρα, τον αριθμό των υπνοδωματίων και των λουτρών, το σπίτι του ZIP κώδικα, το ποσοστό εγκληματικότητας της περιοχής και την ποιότητα των τοπικών σχολείων.

"Βασικά, η μοντελοποίηση δεδομένων είναι η τέχνη της αξιολόγησης των δεδομένων για να μπορέσουμε να βρούμε ενημερωμένες ιδέες και προβλέψεις - να ανακαλύψουμε πρότυπα και σχέσεις", λέει ο Reif.

Είναι μια δεξιότητα στη ζήτηση, επειδή μπορεί να βοηθήσει τις εταιρείες να προβλέψουν και να προβλέψουν μια ποικιλία σεναρίων για να πάρουν πιο ενημερωμένες στρατηγικές αποφάσεις. "Για παράδειγμα, η μοντελοποίηση δεδομένων χρησιμοποιείται για την πρόβλεψη της φθοράς των πελατών - είτε η εταιρεία είναι πιθανό να κρατήσει ή να χάσει έναν πελάτη", εξηγεί ο Reif.

Δεδομένου ότι είναι ακριβότερο να αποκτήσουν νέους πελάτες παρά να τους κρατήσουν, η μοντελοποίηση δεδομένων μπορεί να βοηθήσει τις εταιρείες να εντοπίσουν πελάτες που κινδυνεύουν να χάσουν, ώστε να μπορούν να αναλάβουν δράση.

Και, Reif λέει ότι η μοντελοποίηση δεδομένων είναι επίσης χρήσιμη στην καταπολέμηση της απάτης συναλλαγής. "Για παράδειγμα, πολλές εταιρείες πιστωτικών καρτών παρακολουθούν τα πρότυπα αγορών των πελατών τους και τη συμπεριφορά τους, έτσι ώστε οι αγορές που ξαφνικά δεν πληρούν τις προδιαγραφές μπορούν να προκαλέσουν ειδοποιήσεις, επιτρέποντας στις εταιρείες να επικοινωνούν αμέσως με τους πελάτες τους για να επιβεβαιώσουν την αγορά ή να επισημάνουν την κάρτα".

Πύθων

Ίσως αναρωτιέστε γιατί η Python θα είναι η τρίτη πιο δημοφιλής δεξιότητα των επιστημόνων δεδομένων μεταξύ των πρόσφατων πτυχιούχων. "Η Python είναι μια ισχυρή γλώσσα προγραμματισμού γενικού σκοπού που εμφανίστηκε πρόσφατα ως γλώσσα επιλογής για την επιστήμη των δεδομένων", εξηγεί ο Dr. Manjeet Rege, καθηγητής αναλυτικών δεδομένων στο Πανεπιστήμιο St. Thomas στο St. Paul, Minnesota.

Στην πραγματικότητα, λέει ότι χρησιμοποιείται εκτενώς στην επιστήμη των δεδομένων επειδή είναι πιο φιλόξενο σε σύγκριση με την Java ή C ++. Είναι επίσης δημοφιλές επειδή είναι ένα πρόγραμμα ανοιχτού κώδικα, το οποίο σημαίνει ότι υποστηρίζεται από μια κοινότητα και διατίθεται δωρεάν.

"Για όποιον θέλει να δουλέψει με δεδομένα που ξεπερνούν ένα φύλλο Excel, γνωρίζοντας ότι η Python είναι ουσιαστικά απαραίτητη," εξηγεί ο Reif. "Ενώ υπάρχουν άλλες γλώσσες προγραμματισμού που είναι επίσης σημαντικές και χρήσιμες, αυτό είναι ένα από τα πιο ευρέως χρησιμοποιούμενα."

Εάν ανησυχείτε για την εκμάθηση της Python, ο Rege λέει ότι δεν πρέπει να είστε επειδή πολλές γλώσσες προγραμματισμού είναι παρόμοιες. "Είναι σαν να μαθαίνεις να οδηγείς ένα αυτοκίνητο: Αν ξέρεις πώς να οδηγήσεις μια Toyota Camry, οι περισσότερες από αυτές τις δεξιότητες θα μεταφραστούν στην οδήγηση ενός Honda Civic - και αν καταλάβεις μια γλώσσα προγραμματισμού, θα πάρεις άλλη γλώσσα πιο γρήγορα".

Ο Zou παραδέχεται ότι πραγματικά δεν ενδιαφέρεται για ποια πλατφόρμα λογισμικού χρησιμοποιείται, εφόσον οι αναλύσεις δεδομένων εκτελούνται σωστά. "Ωστόσο, η Python προτιμάται σήμερα από τους περισσότερους επιστήμονες δεδομένων δεδομένου ότι είναι η ταχύτερα αναπτυσσόμενη και πιο δημοφιλής - και ισχυρή - στατιστική γλώσσα προγραμματισμού που εκτελεί προηγμένη ανάλυση δεδομένων, μηχανική μάθηση και οπτικοποίηση σε μεγάλα σύνολα δεδομένων", λέει.

Η Rebecca Merrett, επικεφαλής εκπαιδευτής της Data Science Dojo, η οποία προσφέρει εκκίνηση δεδομένων επιστήμης δεδομένων, συμφωνεί. "Έχω παρατηρήσει ότι η Python γίνεται πιο δημοφιλής τα τελευταία χρόνια και θα έλεγε σαν μια γλώσσα scripting που σας επιτρέπει να κάνετε πρωτότυπα γρήγορα και επίσης έχει έναν εκτενή κατάλογο βιβλιοθηκών για να αυτοματοποιήσετε τα πιο στοιχειώδη καθήκοντα επιστήμης δεδομένων." Όπως η R, λέει η Python έχει μεγάλη υποστήριξη για τα καθήκοντα επιστήμης δεδομένων.

Πώς / πού μπορείτε να μάθετε αυτές τις δεξιότητες

Δεν χρειάζεται να είστε νέος τύπος για να μάθετε αυτές τις δεξιότητες. Ανεξάρτητα από το πού βρίσκεστε στο φάσμα της σταδιοδρομίας, υπάρχουν πολλά μέρη για να μάθετε την οπτικοποίηση δεδομένων, τη μοντελοποίηση δεδομένων και την Python. Μερικοί άνθρωποι επιθυμούν να μάθουν μόνοι τους, ενώ άλλοι προτιμούν τις τάξεις ή τις ομάδες. Οι ειδικοί της επιστήμης των δεδομένων παρέχουν έναν εκτεταμένο και ποικίλο κατάλογο επιλογών.

"Οι νέοι υποψήφιοι που πήρα συνέντευξη αναφέρω στους πολλούς πόρους που χρησιμοποίησαν για να ενισχύσουν τις ικανότητές τους, συμπεριλαμβανομένων των εκπαιδευτικών βιβλίων, των βίντεο του YouTube, των διαγωνισμών Coursera και Kaggle", λέει ο Zou. (Για περισσότερες ηλεκτρονικές πηγές μάθησης, δείτε 6 βασικές έννοιες της επιστήμης των δεδομένων που μπορείτε να αποκτήσετε μέσω της ηλεκτρονικής μάθησης).

Ο Reif προσθέτει ότι εκτός από τα μαθήματα MOOC, μπορείτε επίσης να παρακολουθήσετε μαθήματα κολλεγίων ή ακόμα να ελέγξετε βιβλία βιβλιοθήκης. "Ο Metis διδάσκει επίσης όλες αυτές τις δεξιότητες στα μαθήματα bootcamp επιστήμης δεδομένων και bootcamp προετοιμασία, τα οποία εκχωρούν προ-εργασία πριν ξεκινήσει το bootcamp", λέει ο Reif.

Μια επιλογή για την εκμάθηση της Python; "Απλώς πηγαίνετε στο python.org, κατεβάστε το Python interpreter στον υπολογιστή σας και ακολουθήστε τα μαθήματα εκεί", λέει ο Rege.

"Πολλοί άνθρωποι μαθαίνουν τις τεχνικές δεξιότητες μέσω δωρεάν ηλεκτρονικών πόρων, όπως εκείνοι που απαριθμούνται στον ιστότοπο Open Source Data Science Masters (ο οποίος περιλαμβάνει το δικό του Free SQL School και τα μαθήματα της Python)", λέει ο Steer. "Υπάρχουν επίσης bootcamps όπως Insight ή Galvanize και online μαθήματα από Udacity, Springboard, Datacamp και άλλα", προσθέτει.

Ο Stephen Bailey, ειδικός σε θέματα δεδομένων και ειδικών εργαλείων ανάλυσης στο Immuta, μια πλατφόρμα διαχείρισης δεδομένων, έχει δύο συμβουλές για ανθρώπους που θέλουν να μάθουν αυτές τις δεξιότητες. "Το πρώτο κομμάτι είναι να το κάνεις. πηγαίνετε να δημιουργήσετε μια απεικόνιση στο Tableau. πηγαίνετε να γράψετε ένα απλό σενάριο Python. μετατρέψτε μια πτυχή της ζωής σας σε ένα υπολογιστικό φύλλο. "Ενώ μπορείτε να μάθετε ένα εργαλείο ή μια τεχνική από την παρακολούθηση ενός βίντεο, λέει ότι μπορείτε μόνο να μάθετε την τέχνη από την πρακτική.

Η δεύτερη συμβουλή του είναι να συναντάς ανθρώπους. "Οι κοινότητες λογισμικού και δεδομένων είναι απίστευτα φιλόξενοι", λέει ο Bailey. "Είναι γεμάτος με ανθρώπους που θέλουν να σας κατευθύνουν προς τη σωστή κατεύθυνση. Επίσης, μπορείτε να βρείτε κάποιον στην κοινότητα του LinkedIn και να τον προσκαλέσετε για καφέ. "

Η Bailey λέει ότι μπορείτε να μάθετε περισσότερα, αλλά και να διασκεδάσετε περισσότερο, σε 30 λεπτά μιλώντας με κάποιον παρά να ξοδεύετε μια μέρα ψάχνοντας στο διαδίκτυο.