Καταλόγους δεδομένων και τη μαρίμανση της αγοράς μάθησης μηχανών

Συγγραφέας: Roger Morrison
Ημερομηνία Δημιουργίας: 28 Σεπτέμβριος 2021
Ημερομηνία Ενημέρωσης: 21 Ιούνιος 2024
Anonim
Καταλόγους δεδομένων και τη μαρίμανση της αγοράς μάθησης μηχανών - Τεχνολογία
Καταλόγους δεδομένων και τη μαρίμανση της αγοράς μάθησης μηχανών - Τεχνολογία

Περιεχόμενο


Πηγή: Nmedia / Dreamstime.com

Πάρε μακριά:

Η αγορά του MLDC αναπτύσσεται και οι επιχειρήσεις που επιδιώκουν να αξιοποιήσουν αποτελεσματικά τα μεγάλα δεδομένα με τη μηχανική μάθηση θα πρέπει να γνωρίζουν τα κορυφαία ονόματα στον τομέα και τις μεμονωμένες βαθμολογίες τους.

Αυτή είναι η ηλικία των μεγάλων δεδομένων. Πλημμυρίζουμε με πληροφορίες και οι επιχειρήσεις βρίσκουν μια πρόκληση να διαχειριστούν και να εξαγάγουν την αξία τους.

Η σημερινή ροή μεγάλων δεδομένων συνεπάγεται όχι μόνο τον όγκο, την ποικιλία και την ταχύτητα, αλλά και την πολυπλοκότητα. Όπως προσδιορίζεται από το SAS στο Big Data History και Current Considerations, αυτό είναι ένας παράγοντας των ρευμάτων "από πολλές πηγές, γεγονός που καθιστά δύσκολη τη σύνδεση, την αντιστοίχιση, τον καθαρισμό και τη μετατροπή δεδομένων σε συστήματα". (Θέλετε να μάθετε περισσότερα για τα μεγάλα δεδομένα; ​​Ανατρέξτε στα (μεγάλα) Datas Big Future.)

Η εύρεση πολύτιμων στοιχείων δεν είναι θέμα συγκέντρωσης όσο το δυνατόν περισσότερων δεδομένων, αλλά εύρεσης των σωστών δεδομένων. Είναι αδύνατο να δουλέψουμε όλα αυτά με χειροκίνητες διαδικασίες. Αυτός είναι ο λόγος για τον οποίο ολοένα και περισσότερες επιχειρήσεις στρέφονται προς καταλόγους δεδομένων για να εκδημοκρατίσουν την πρόσβαση στα δεδομένα, να επιτρέψουν τη φυλετική γνώση δεδομένων για να καθαρίσουν τις πληροφορίες, να εφαρμόσουν πολιτικές δεδομένων και να ενεργοποιήσουν γρήγορα όλα τα δεδομένα για επιχειρηματική αξία.


Αυτό είναι όπου οι κατάλογοι δεδομένων (μερικές φορές επίσης γνωστοί ως κατάλογοι πληροφοριών) εισάγονται στην εικόνα. Όπως ορίζονται εδώ, ενδυναμώνουν "τους χρήστες να διερευνήσουν τις απαιτούμενες πηγές δεδομένων τους και να κατανοήσουν τις πηγές δεδομένων που διερευνήθηκαν και παράλληλα να βοηθήσουν τους οργανισμούς να επιτύχουν μεγαλύτερη αξία από τις σημερινές επενδύσεις τους". Ένας από τους τρόπους που κάνει αυτό είναι να επιτρέψει πολύ μεγαλύτερη πρόσβαση στα δεδομένα, μεταξύ διαφορετικών τύπων χρηστών που μπορούν να κάνουν χρήση ή να συμβάλλουν σε αυτό.

Η επιταγή της Infonomics

Σημειώνοντας τη δραματικά αυξημένη ζήτηση για καταλόγους δεδομένων στο τέλος του 2017, ο Gartner τους ονόμασε "το νέο μαύρο". Γίνονταν αναγνωρισμένες ως μια γρήγορη και οικονομική λύση "για την απογραφή και ταξινόμηση των οργανισμών που διανέμονται ολοένα και περισσότερο και αποδιοργανώνουν δεδομένα και χαρτογραφούν τις αλυσίδες εφοδιασμού τους". Η αναγκαιότητα αυτού προέκυψε λόγω της άνοιας της «ακονονομίας», η οποία απαιτεί την εφαρμογή της ίδιας λεπτομέρειας στην παρακολούθηση των πληροφοριών, όπως και η διαχείριση άλλων περιουσιακών στοιχείων της επιχείρησης. (Για περισσότερες πληροφορίες σχετικά με τις αλυσίδες εφοδιασμού, ανατρέξτε στο θέμα Πώς η εκμάθηση μηχανών μπορεί να βελτιώσει την απόδοση της αλυσίδας εφοδιασμού.)


Οι Gartners παίρνουν jibes με το The Forrester Wave ™: Καταλόγους Δεδομένων Μηχανικής Μάθησης, Q2 2018. Περισσότεροι από τους μισούς συμμετέχοντες στην έρευνα αναφέρουν ότι σχεδιάζουν να δημιουργήσουν την υλοποίηση του καταλόγου τους. Πιθανότατα ήταν εν πολλοίς κίνητρα από το γεγονός ότι ο καθένας είχε τουλάχιστον 7 λίμνες δεδομένων στην οργάνωσή τους. Όπως εξηγείται από τους καταλόγους δεδομένων Gartner, οι κατάλογοι δεδομένων είναι ιδιαίτερα χρήσιμοι για την εξαγωγή "του con, της σημασίας και της αξίας των δεδομένων" που συνήθως αφήνονται σε μια μη ταξινομημένη μορφή σε μια λίμνη δεδομένων.

Ο Forrester αναφέρει ότι περισσότερο από το ένα τρίτο των φορέων λήψης αποφάσεων για δεδομένα και αναλύσεις αντιμετώπισαν δεδομένα ύψους 1.000TB ή περισσότερα το 2017, ποσό που αναφέρθηκε μόνο μεταξύ 10 και 14% το προηγούμενο έτος. Η διαχείριση δεδομένων σχετικά με αυτήν την κλίμακα αποτελεί μια αυξανόμενη πρόκληση ή συγκεκριμένα δύο προκλήσεις:

"1) τη συγχώνευση των υπαρχουσών επιχειρηματικών διαδικασιών με την προέλευση δεδομένων για την ανάλυση και την εφαρμογή πληροφοριών και 2) την προμήθεια, συγκέντρωση, διαχείριση και διαχείριση των δεδομένων καθώς μεγαλώνει".

No Bugs, No Stress - Ο οδηγός σας βήμα προς βήμα για τη δημιουργία λογισμικού που αλλάζει τη ζωή χωρίς να καταστρέφει τη ζωή σας

Δεν μπορείτε να βελτιώσετε τις δεξιότητες προγραμματισμού σας όταν κανείς δεν ενδιαφέρεται για την ποιότητα του λογισμικού.

Τι οι κατάλογοι δεδομένων μπορούν να κάνουν για τις επιχειρήσεις

Η Gartner προσδιορίζει συγκεκριμένους τρόπους με τους οποίους οι κατάλογοι δεδομένων μπορούν να βελτιώσουν τη ροή πληροφοριών και παραγωγικότητας των οργανώσεων:

  • Συγκέντρωση και επικοινωνία του ενημερωμένου αποθέματος πληροφοριών που είναι διαθέσιμο στον οργανισμό.

  • Δημιουργία του κοινού γλωσσάριου των επιχειρηματικών όρων που καθορίζει τη σημασιολογική ερμηνεία και τη σημασία των δεδομένων των οργανισμών, παρέχοντας έτσι τα μέσα για τη μεσολάβηση και την επίλυση των ασυνεπειών των ορισμών.

  • Ενεργοποιώντας ένα δυναμικό και ευέλικτο περιβάλλον συνεργασίας που επιτρέπει στους συναδέλφους των επιχειρήσεων και των IT να σχολιάζουν, να τεκμηριώνουν και να μοιράζονται δεδομένα.

  • Παροχή διαφάνειας χρήσης δεδομένων με ανάλυση γραμμών και επιπτώσεων.

  • Παρακολούθηση, έλεγχος και παρακολούθηση δεδομένων για τη στήριξη των διαδικασιών διακυβέρνησης της πληροφόρησης.

  • Καταγραφή μεταδεδομένων για βελτίωση της εσωτερικής ανάλυσης της χρήσης και επαναχρησιμοποίησης δεδομένων, βελτιστοποίηση των ερωτημάτων και πιστοποίηση δεδομένων.

  • Εξοικονόμηση πληροφοριών στο πλαίσιο της επιχειρηματικής τους χρήσης, καταγράφοντας, ανακοινώνοντας και αναλύοντας ποια δεδομένα υπάρχουν, από ποια στοιχεία προέρχονται, σε ποια αντίληψη χρησιμοποιούνται, γιατί είναι αναγκαία, πώς ρέει μεταξύ διαδικασιών και συστημάτων, ποιος είναι υπεύθυνος γι 'αυτό, τι σημαίνει και τι αξία έχει.

Η σωστή ταυτοποίηση και πρόσβαση των δεδομένων στα άτομα-κλειδιά του οργανισμού είναι σημαντική, σύμφωνα με την έκθεση της Gartner, όχι μόνο για να βρεθεί ο τρόπος "να δημιουργηθούν έσοδα από στοιχεία δεδομένων για ψηφιακά αποτελέσματα της επιχείρησης", αλλά να συμμορφωθούν με τους κανονισμούς, (HIPAA) ή γενικότερου χαρακτήρα όπως ο Γενικός Κανονισμός για την Προστασία των Δεδομένων (GDPR).

Προσθήκη στη μάθηση μηχανών

Αλλά τίποτα δεν είναι χωρίς τα μειονεκτήματά του. Για τους καταλόγους δεδομένων, το πρόβλημα ήταν η αργή και κουραστική διαδικασία που συνεπάγεται η χειροκίνητη δημιουργία τους με όλα τα μεταδεδομένα που πρέπει να τεθούν σε εφαρμογή. Εδώ μπαίνει το εξάρτημα εκμάθησης μηχανών.

Οι κατάλογοι δεδομένων που αξιολογούνται από τον Forrester ονομάζονται MLDCs επειδή αξιοποιούν τη δύναμη της μηχανικής μάθησης, ένα από τα συστατικά του AI. Όπως εξηγείται στο ιστολόγιο δεδομένων Podium, αυτό καθιστά δυνατή την "δημιουργία ενός μόνιμου αποθετηρίου μεταδεδομένων και στη συνέχεια εφαρμογή ML / AI για να ξεφύγει και να εκθέσει δυνητικά χρήσιμες γνώσεις γύρω από τα υποκείμενα στοιχεία δεδομένων".

Πώς να επιλέξετε

Για να βοηθήσει τους οργανισμούς να αξιολογήσουν ποιες επιχειρήσεις θα επιλέξουν, η Forrester υπέβαλε 29 βαθμούς αξιολόγησης στους 12 πρώτους MLDC. Προσδιόρισε τους ηγέτες αυτής της αγοράς όπως: IBM, Relito, Unifi Software, Alation και Collibra. Οι ισχυροί εκτελεστές που βρέθηκαν είναι Informatica, Oracle, Waterline Data, Infogix, Cambridge Semantics και Cloudera. Το Hortonworks βρίσκεται μόνο στο βαθμό του "υποψήφιος".

Ωστόσο, δεν πρέπει να πάει μόνο από τις συνολικές βαθμολογίες. Η έκθεση αναλύει τις ιδιαίτερες δυνάμεις και τις αδυναμίες του καθενός. Συνεπώς, αν ένα συγκεκριμένο χαρακτηριστικό, όπως η έρευνα και η ανάπτυξη, είναι υψίστης σημασίας για μια οργάνωση, μπορεί να θεωρήσει την Hortonworks ως ισότιμη με την IBM και την Colilbra γι 'αυτήν την πτυχή, διότι οι τρεις αυτοί μοιράζονται το κορυφαίο αποτέλεσμα των πέντε για αυτή την ποιότητα δύο σημεία καλύτερα από το Alation και Coloudera και τέσσερα σημεία καλύτερα από το Cambridge Semantics.

Ως εκ τούτου, η έκθεση Forrester συμβουλεύει εκείνους που χρησιμοποιούν την έκθεσή της για καθοδήγηση να μην υποθέσει ότι η κορυφαία εταιρεία είναι η καλύτερη επιλογή για όλους. Πρέπει να δίνουν ιδιαίτερη προσοχή στην κατανομή της αξιολόγησης για να βρουν αυτό που ικανοποιεί τις ιδιαίτερες απαιτήσεις τους.