Οι σημερινές μεγάλες προκλήσεις δεδομένων προκαλούν ποικιλία, όχι όγκο ή ταχύτητα

Συγγραφέας: Judy Howell
Ημερομηνία Δημιουργίας: 28 Ιούλιος 2021
Ημερομηνία Ενημέρωσης: 1 Ιούλιος 2024
Anonim
Disruption - Day 2 - Part 1 (ENG)
Βίντεο: Disruption - Day 2 - Part 1 (ENG)

Περιεχόμενο


Πάρε μακριά:

Πολλά τμήματα πληροφορικής ρίχνουν ό, τι έχουν στα θέματα όγκου και ταχύτητας δεδομένων, ξεχνώντας να αντιμετωπίσουν το θεμελιώδες ζήτημα της ποικιλίας των δεδομένων.

Η πρόκληση της διαχείρισης και αξιοποίησης των μεγάλων δεδομένων προέρχεται από τρία στοιχεία, σύμφωνα με τον Doug Laney, αντιπρόεδρο έρευνας της Gartner. Ο Laney διαπίστωσε για πρώτη φορά πριν από μια δεκαετία ότι τα μεγάλα δεδομένα δημιουργούν ένα τέτοιο πρόβλημα για την επιχείρηση, διότι εισάγει έναν δύσκολο να διαχειριστεί όγκο, ταχύτητα και ποικιλία. Το πρόβλημα είναι ότι πάρα πολλά τμήματα πληροφορικής ρίχνουν ό, τι έχουν στα θέματα όγκου και ταχύτητας δεδομένων, ξεχνώντας να αντιμετωπίσουν το θεμελιώδες ζήτημα της ποικιλίας των δεδομένων.

Το 2001, η Laney έγραψε ότι "οι κορυφαίες επιχειρήσεις θα χρησιμοποιούν όλο και περισσότερο μια κεντρική αποθήκη δεδομένων για να καθορίσουν ένα κοινό επιχειρηματικό λεξιλόγιο που βελτιώνει την εσωτερική και εξωτερική συνεργασία". Το ζήτημα αυτού του λεξιλογίου - και η διακύμανση που εμποδίζει τις εταιρείες να το δημιουργήσουν - εξακολουθεί να είναι η λιγότερο αντιμετωπισμένη πτυχή του μεγάλου χάσματος δεδομένων σήμερα. (Δείτε τι άλλοι εμπειρογνώμονες έχουν να πουν. Ανατρέξτε στους εμπειρογνώμονες μεγάλων δεδομένων που θα ακολουθήσουν.)


Τρία μεγάλα δεδομένα

Πολλές επιχειρήσεις έχουν βρει μεθόδους για την αξιοποίηση του αυξημένου όγκου και ταχύτητας δεδομένων. , για παράδειγμα, μπορεί να αναλύσει τεράστιους όγκους δεδομένων. Φυσικά, τα δεδομένα αυτά παρουσιάζονται συχνά ξανά και ξανά μέσα στις ίδιες παραμέτρους. Αυτό οδήγησε σε τεχνολογικές καινοτομίες, όπως οι βάσεις δεδομένων των στηλών, οι οποίες σήμερα χρησιμοποιούνται ευρέως από άλλες εταιρείες που αντιμετωπίζουν εξίσου μεγάλες αποθήκες παρόμοιων στοιχείων δεδομένων.

Όσον αφορά την ταχύτητα εξάπλωσης, οι πωλητές όπως οι εταιρείες βοήθειας Splunk αναλύουν γρήγορα δημιουργούμενα δεδομένα μέσω αρχείων καταγραφής που συλλαμβάνουν αρκετές χιλιάδες γεγονότα ανά δευτερόλεπτο. Αυτή η ανάλυση συμβάντων μεγάλης ποσότητας στοχεύει σε περιπτώσεις χρήσης της παρακολούθησης της ασφάλειας και της επίδοσης. Όπως και με την πρόκληση του όγκου δεδομένων, η πρόκληση ταχύτητας αντιμετωπίστηκε σε μεγάλο βαθμό μέσω εξεζητημένων τεχνικών ευρετηρίασης και κατανεμημένων αναλύσεων δεδομένων που επιτρέπουν την ικανότητα επεξεργασίας σε κλίμακα με αυξημένη ταχύτητα δεδομένων.


Όσον αφορά την ποικιλία, όμως, πολλές επιχειρήσεις εξακολουθούν να αντιμετωπίζουν ένα μεγάλο πρόβλημα στην προσέγγισή τους σε μεγάλες αναλύσεις δεδομένων. Το πρόβλημα αυτό οφείλεται σε τρεις παράγοντες: Πρώτον, λόγω της ανάπτυξης, των εξαγορών και των τεχνολογικών καινοτομιών που προσθέτουν νέα συστήματα στο περιβάλλον, οι επιχειρήσεις είναι κλειδωμένες σε ένα εξαιρετικά ετερογενές περιβάλλον και αυτή η ετερογένεια αυξάνεται μόνο με το χρόνο. Οι επιχειρήσεις πρέπει να παρακολουθούν πληθώρα τύπων συστημάτων και να διαχειρίζονται δεκάδες χιλιάδες τύπους δεδομένων, καθώς και τα ίδια δεδομένα να αντιπροσωπεύονται χρησιμοποιώντας διαφορετικές ονοματολογίες και μορφές.

Δεύτερον, αυτά τα συστήματα και οι τύποι δεδομένων σε πολλές περιπτώσεις αναφέρουν τόσο τις σχετικές πληροφορίες όσο και τις πληροφορίες που μπορούν να φιλτραριστούν με ασφάλεια ως άσχετες με το πρόβλημα που αντιμετωπίζεται. Υπάρχει ανάγκη να προσδιοριστούν με αξιοπιστία οι επιπτώσεις των πληροφοριών.

Η τρίτη διάσταση στην πρόκληση της ποικιλίας είναι η σταθερή μεταβλητότητα ή η αλλαγή στο περιβάλλον. Τα συστήματα αναβαθμίζονται, εισάγονται νέα συστήματα, προστίθενται νέοι τύποι δεδομένων και εισάγεται νέα ονοματολογία. Αυτό επιπλέον παραμορφώνει την ικανότητά μας να εξημερώσουμε την πρόκληση της ποικιλίας δεδομένων. Αυτό προσθέτει ένα πρόσθετο στρώμα στην πρόκληση ποικιλίας. (Για περισσότερη διορατικότητα, ελέγξτε τα μεγάλα δεδομένα: Πώς έχουν ληφθεί, απορροφηθεί και χρησιμοποιηθεί για να κάνετε επιχειρηματικές αποφάσεις.)

Αντιμετώπιση του προβλήματος της ποικιλίας δεδομένων

Για την αντιμετώπιση του προβλήματος της ποικιλομορφίας των δεδομένων, οι επιχειρήσεις πρέπει να ξεκινήσουν από τον τομέα πληροφορικής, καθώς συχνά αντιπροσωπεύουν τόσο τους χειρότερους παραβάτες όσο και τα χειρότερα θύματα του προβλήματος της ποικιλίας. Το πρώτο βήμα είναι να ξεκινήσετε με έναν ολοκληρωμένο ορισμό ή ταξινόμηση όλων των στοιχείων ή στοιχείων ενεργητικού. Αυτό παρέχει μια βασική γραμμή ή ένα ίδρυμα για να αναφέρεται σε οτιδήποτε μέσα ή γύρω από την πληροφορική και επιτρέπει στις επιχειρήσεις να διαχειριστούν την αυξανόμενη ετερογένεια έναντι μιας γνωστής ταξινόμησης ή ορολογίας.

No Bugs, No Stress - Ο οδηγός σας βήμα προς βήμα για τη δημιουργία λογισμικού που αλλάζει τη ζωή χωρίς να καταστρέφει τη ζωή σας

Δεν μπορείτε να βελτιώσετε τις δεξιότητες προγραμματισμού σας όταν κανείς δεν ενδιαφέρεται για την ποιότητα του λογισμικού.

Το επόμενο βήμα είναι να προσδιορίσουμε τους πολυάριθμους τρόπους που αντιπροσωπεύει το ίδιο αντικείμενο σε διαφορετικά συστήματα εγγραφής. Αυτό δίνει τη δυνατότητα στους επαγγελματίες της πληροφορικής να εξετάζουν το ετερογενές περιβάλλον τους και να φιλτράρουν και να συμπιέζουν τα δεδομένα σε σχετικά και διαχειρίσιμα κομμάτια.

Τέλος, οι υπεύθυνοι πληροφορικής πρέπει να υιοθετήσουν μια διαδικασία συνεχούς εξέτασης του περιβάλλοντος για αλλαγές όπως οι νέοι τύποι στοιχείων που εισάγονται ή η νέα ονοματολογία για να αναφερθούν στο ίδιο στοιχείο.

Με αυτά τα βήματα, οι οργανισμοί πληροφορικής μπορούν να διαχειριστούν το πρόβλημα ποικιλίας και να αντλήσουν βαθιές ιδέες που έχουν ιστορικά ξεφύγει από τις ομάδες πληροφορικής. Επιπλέον, η διαχείριση του προβλήματος ποικιλίας βελτιώνει σημαντικά την απόδοση των επενδύσεών τους σε εργαλεία και τεχνικές που αντιμετωπίζουν τα πιο παραδοσιακά μεγάλα προβλήματα δεδομένων όγκου και ταχύτητας.