Μεγάλη ανάλυση δεδομένων ανοιχτού κώδικα

Συγγραφέας: Laura McKinney
Ημερομηνία Δημιουργίας: 1 Απρίλιος 2021
Ημερομηνία Ενημέρωσης: 14 Ενδέχεται 2024
Anonim
O δημιουργικός κώδικας ανοίγει νέους ορίζοντες στη τέχνη | Georgios Cherouvim | TEDxIonianUniversity
Βίντεο: O δημιουργικός κώδικας ανοίγει νέους ορίζοντες στη τέχνη | Georgios Cherouvim | TEDxIonianUniversity

Περιεχόμενο

Ορισμός - Τι σημαίνει το Big Data Analytics Open Source;

Οι μεγάλες αναλύσεις δεδομένων ανοιχτού κώδικα αφορούν τη χρήση λογισμικού και εργαλείων ανοιχτού κώδικα για την ανάλυση τεράστιων ποσοτήτων δεδομένων, προκειμένου να συγκεντρωθούν σχετικές και εφαρμόσιμες πληροφορίες που μπορεί να χρησιμοποιήσει ένας οργανισμός για την προώθηση των επιχειρηματικών του στόχων. Ο μεγαλύτερος παίκτης στην ανάλυση μεγάλων δεδομένων ανοιχτού κώδικα είναι ο Apaches Hadoop - είναι η ευρέως χρησιμοποιούμενη βιβλιοθήκη λογισμικού για την επεξεργασία τεράστιων συνόλων δεδομένων σε ένα σύμπλεγμα υπολογιστών χρησιμοποιώντας μια κατανεμημένη διαδικασία παραλληλισμού.


Εισαγωγή στη Microsoft Azure και το Microsoft Σε αυτό τον οδηγό θα μάθετε τι είναι το cloud computing και πώς η Microsoft Azure μπορεί να σας βοηθήσει να μεταφέρετε και να εκτελέσετε την επιχείρησή σας από το cloud.

Η Techopedia εξηγεί το Big Data Analytics Open-Source

Οι μεγάλες αναλύσεις δεδομένων ανοιχτού κώδικα χρησιμοποιούν λογισμικό και εργαλεία ανοικτού κώδικα για την εκτέλεση μεγάλων αναλύσεων δεδομένων είτε με τη χρήση μιας ολόκληρης πλατφόρμας λογισμικού είτε με διάφορα εργαλεία ανοιχτού κώδικα για διαφορετικές εργασίες στη διαδικασία της ανάλυσης δεδομένων. Το Apache Hadoop είναι το πιο γνωστό σύστημα για τις μεγάλες αναλύσεις δεδομένων, αλλά απαιτούνται και άλλα στοιχεία πριν από τη δημιουργία ενός πραγματικού συστήματος ανάλυσης.

Hadoop είναι η εφαρμογή ανοιχτού κώδικα του αλγορίθμου MapReduce που πρωτοστάτησε από την Google και το Yahoo, οπότε αποτελεί τη βάση των περισσότερων συστημάτων ανάλυσης σήμερα. Πολλά μεγάλα εργαλεία ανάλυσης δεδομένων χρησιμοποιούν ανοικτού κώδικα, συμπεριλαμβανομένων ισχυρών συστημάτων βάσεων δεδομένων όπως το MongoDB ανοιχτού κώδικα, μια εξελιγμένη και κλιμακούμενη βάση δεδομένων NoSQL κατάλληλη για μεγάλες εφαρμογές δεδομένων καθώς και άλλες.


Οι μεγάλες υπηρεσίες ανάλυσης δεδομένων ανοικτού κώδικα περιλαμβάνουν:

  • Σύστημα συλλογής δεδομένων
  • Κέντρο ελέγχου για τη διαχείριση και την παρακολούθηση συμπλεγμάτων
  • Εκπαιδευτική μηχανή και βιβλιοθήκη εξόρυξης δεδομένων
  • Υπηρεσία συντονισμού εφαρμογών
  • Υπολογισμός μηχανής
  • Πλαίσιο εκτέλεσης