5 Προειδοποιητικά σημάδια μιας αποτυχίας κρίσιμου εξοπλισμού

Συγγραφέας: Judy Howell
Ημερομηνία Δημιουργίας: 25 Ιούλιος 2021
Ημερομηνία Ενημέρωσης: 23 Ιούνιος 2024
Anonim
Words at War: White Brigade / George Washington Carver / The New Sun
Βίντεο: Words at War: White Brigade / George Washington Carver / The New Sun

Περιεχόμενο


Πάρε μακριά:

Η μείωση του χρόνου διακοπής μέσω ενός σχολαστικού εκ των προτέρων σχεδιασμού μπορεί να σημαίνει τη διαφορά μεταξύ της ανάπτυξης των επιχειρήσεων και της πτώσης. Εκεί βρίσκεται ο μέσος χρόνος μεταξύ αποτυχίας.

Μην υποτιμάτε πόσο οι σημερινές εταιρείες βασίζονται σε κρίσιμα συστήματα κάθε μέρα. Αυτός είναι ο λόγος για τον οποίο η μόνη κοινή λογική ότι μια επιχείρηση μπορεί να μετρήσει τον κίνδυνο αποτυχίας του εξοπλισμού. Χωρίς εγγυήσεις για το πότε μπορεί να αποτύχει ένα κομμάτι του εξοπλισμού, πρέπει τουλάχιστον να υπάρχει μια ακριβής εκτίμηση του πότε δεν μπορεί πλέον να θεωρηθεί αξιόπιστη.

Ένα κατά τα άλλα αόρατο κομμάτι του εξοπλισμού ίσως να μην φαίνεται κρίσιμο για μια επιχείρηση, αλλά όταν αποτυγχάνει ένας μόνο ανεμιστήρας ψύξης, αναγκάζει μια γεννήτρια να εγκαταλείψει το φάντασμα και προκαλεί δαπανηρά προβλήματα για δεκάδες ή και εκατοντάδες χιλιάδες χρήστες για μεγάλο χρονικό διάστημα. δείτε ότι είναι σε θέση να εκτιμήσετε ποια στοιχεία της υποδομής σας ενδέχεται να αποτύχουν - και πότε - είναι υψίστης σημασίας. Εκεί όπου έρχεται ο μέσος χρόνος μεταξύ αποτυχιών (MTBF), η μέθοδος στην οποία βασίζονται οι επαγγελματίες πληροφορικής για να δώσουν ακριβείς πληροφορίες υπολογίζει σχετικά με το πότε θα αποτύχει ο κρίσιμος εξοπλισμός. Εδώ θα ρίξουμε μια ματιά σε αυτό που τελικά σκοτώνει κάποιους κοινούς τύπους κρίσιμου εξοπλισμού και πώς το MTBF μπορεί να βοηθήσει να σώσουμε την ημέρα.


Τι είναι MTBF;

Σε κάθε κομμάτι εξοπλισμού πληροφορικής που κατασκευάζεται αποδίδεται ένας μοναδικός αριθμός μοντέλου. Εκείνοι που παίζουν κάποιο ρόλο στην υποδομή ζωτικής σημασίας παρέχονται σε πελάτες με εκτίμηση MTBF. Οι σύνθετοι υπολογισμοί για την εκπόνηση του MTBF για ένα κομμάτι εξοπλισμού λαμβάνουν χώρα κατά τη διάρκεια της μακράς φάσης δοκιμής στο πλαίσιο μιας έρευνας και ανάπτυξης προϊόντων και είναι σχετικά συγκεκριμένα σε ένα συγκεκριμένο μοντέλο.

Αν ψάχνετε να βρείτε το MTBF για συγκεκριμένο εξοπλισμό, θα το βρείτε στο αναλυτικό φύλλο προδιαγραφών που παρέχεται από τον κατασκευαστή. Μπορείτε επίσης να επικοινωνήσετε απευθείας με τον κατασκευαστή.

Δρομολόγηση

Ένας δρομολογητής επιχειρηματικής ποιότητας περιλαμβάνει πολλά μέρη, μερικά κινούμενα και άλλα στατικά. Οι μονάδες τροφοδοσίας (PSU) και οι ανεμιστήρες ψύξης έχουν κινούμενα μέρη και τα στοιχεία τους που τείνουν να είναι σημεία βλάβης, ειδικά εάν η μονάδα δεν στεγάζεται μέσα σε ένα σχετικά κέντρο δεδομένων χωρίς σκόνη. Ευτυχώς, με κάποια είσοδο διαχειριστή οι περισσότεροι δρομολογητές θα αναφέρουν σε ένα SysLog εγκατάσταση, έτσι ώστε τυχόν αποτυχημένα στοιχεία να μπορούν να σημαίνονται.


Διακόπτες

Σε μια παρόμοια φλέβα, το επόμενο επίπεδο στο εσωτερικό ενός επιχειρηματικού δικτύου είναι το υλικό μεταγωγής. Παρόλο που οι διακόπτες υψηλής τάσης τείνουν να βασίζονται σε ανεμιστήρες, υπάρχουν συνήθως λιγότερες από αυτές που βρίσκονται μέσα σε ένα πλαίσιο δρομολογητή. Εάν οι μηχανισμοί των ανεμιστήρων είναι άθικτοι, τότε ένας ελαττωματικός διακόπτης συνήθως θα παρουσιάσει λάθος στο επίπεδο του λογισμικού είτε απενεργοποιώντας απροσδόκητα μια θύρα μεταγωγής είτε, πιο συχνά, παρουσιάζοντας ασυνήθιστη συμπεριφορά όπως πτώση πακέτων, προκαλώντας διαφορετικά επίπεδα διακοπής της κυκλοφορίας ή λανθασμένη αλλαγή χωρίς να ζητηθεί από αυτόν.

Ο μεγαλομέτορας δικτύωσης Cisco διαφημίζει έναν από τους δρομολογητές του ότι έχει MTBF 188.574 ώρες για το μοντέλο Cisco Catalyst 3750G-24TS. Αν το διαιρέσουμε με 8.765.81277 (τον αριθμό των ωρών σε ένα χρόνο) τότε βλέπουμε ότι αυτό το μοντέλο έχει μια εκτίμηση MTBF περίπου 21,5 χρόνια. Αυτός ο αριθμός έχει κάποια διαβεβαίωση όταν θεωρείτε ότι αυτός ο εξοπλισμός πρέπει να λειτουργεί καλά 24/7 χωρίς βλάβη, αν και στην πραγματικότητα είναι απλά ένδειξη της αξιοπιστίας του. Παρόλα αυτά, παρέχει στους χρήστες μια εκπαιδευμένη εικασία σχετικά με το πόσο χρόνο μπορεί να αναμένεται ότι αυτό το κομμάτι του εξοπλισμού θα διαρκέσει.

Ανθεκτική ισχύς

Τα αδιάλειπτα τροφοδοτικά (UPS) που συνδέονται με μεγάλο αριθμό μπαταριών μπορούν να παράσχουν εφεδρική ισχύ στην επιχείρηση κατά τη διάρκεια της σύντομης ξόρκις πριν οι γεννήτριες γυρίσουν κατά τη διάρκεια μιας διακοπής ρεύματος. Ορισμένα συγκεκριμένα σφάλματα λογισμικού μπορούν να υλοποιηθούν μέσα σε ένα UPS, όπως συμβαίνει με οποιοδήποτε εξοπλισμό, αλλά γενικά, οι μπαταρίες από τις οποίες αντλούν ενέργεια συνήθως προκαλούν το μεγαλύτερο ενδιαφέρον. Αν μια μπαταρία UPS είναι συχνά σβηστή και επαναφορτίζεται, η χωρητικότητά της θα μειωθεί πιο γρήγορα και ο χρόνος λειτουργίας της θα μειωθεί δραματικά. Δεν είναι έκπληξη το γεγονός ότι είναι επίσης πιθανό να αποτύχουν πλήρως οι μπαταρίες UPS. Ένα UPS μπορεί να αναφέρει τα μόντεμ και τα δίκτυα όταν αναπτύσσονται σφάλματα, αλλά συχνότερα, τα παλαιότερα UPS θα ενεργοποιήσουν ακουστικά συναγερμούς όταν προκύψει πρώτα ένα ζήτημα.

No Bugs, No Stress - Ο οδηγός σας βήμα προς βήμα για τη δημιουργία λογισμικού που αλλάζει τη ζωή χωρίς να καταστρέφει τη ζωή σας

Δεν μπορείτε να βελτιώσετε τις δεξιότητες προγραμματισμού σας όταν κανείς δεν ενδιαφέρεται για την ποιότητα του λογισμικού.

Προστατευμένη αποθήκευση

Οι σκληροί δίσκοι που χρησιμοποιούμε σήμερα και βασιζόμαστε σε τόσο υψηλό βαθμό έχουν γίνει σημαντικά πιο αξιόπιστοι κατά την τελευταία δεκαετία ή έτσι. Είναι, ωστόσο, πολύ μακριά από το να είναι αλάθητοι και, ανάλογα με τη μελέτη που πιστεύετε, φαίνεται ότι λειτουργούν σωστά για μεγαλύτερο χρονικό διάστημα, ανάλογα με διάφορους παράγοντες. (Ένα καλό σχόλιο σχετικά με αυτό μπορεί να βρεθεί εδώ στο The Remarketer.) Αν η αναλυτική αναφορά είναι ενεργοποιημένη και η μονάδα παρέχει ανατροφοδότηση για σφάλματα, τότε οι διεφθαρμένοι τομείς και οι αποτυχίες ανάγνωσης / ανάγνωσης είναι το κλειδί για την επισήμανση όταν ένας δίσκος μέσα σε μια συστοιχία αποθήκευσης αποτυγχάνει. Ένα άλλο κοινό ζήτημα στους διακομιστές που χρησιμοποιούν διάφορους δίσκους συνδεδεμένους σε ελεγκτή RAID είναι ότι ο ίδιος ο ελεγκτής θα αποτύχει. Δυστυχώς, μερικές φορές οι σκληροί δίσκοι απλώς σταματούν να λειτουργούν χωρίς καμία προειδοποίηση, ένα ζήτημα που είναι δύσκολο να αποφευχθεί με αξιοπιστία.

Διακομιστές

Εκτός από τις μονάδες που είναι ενσωματωμένες σε διακομιστές και τα κινούμενα μέρη, όπως οι προαναφερθέντες ανεμιστήρες ψύξης και οι μονάδες PSU, μπορεί επίσης να προκύψουν ορισμένα προβλήματα σε ένα στοιχείο υλικού διακομιστή. Η αναφορά σε επίπεδο λογισμικού (η οποία συνήθως αναφέρεται στο BIOS ή σε άλλο διαγνωστικό στοιχείο υλικού χαμηλού επιπέδου) είναι το κλειδί για την επισήμανση όταν τα πράγματα έχουν αποτύχει ή, το πιο σημαντικό, δείχνουν σημάδια αποτυχίας. Ένα ζήτημα που μπορεί να μην είναι άμεσα προφανές είναι αυτό που επηρεάζει τις μητρικές πλακέτες. Έχει την αίσθηση ότι τα μηχανήματα δεν έχουν πάρα πολύ θερμότητα. Αλλά ακόμη και σήμερα, εάν ένας σύγχρονος πίνακας κυκλωμάτων υποστεί μια γρήγορη απώλεια θερμότητας - ή πηγαίνει από το να τρέχει πολύ ζεστό και ξαφνικά να γίνει κρύο - μπορεί να εμφανιστούν ρωγμές, προκαλώντας καταστροφή του σκάφους. Είναι ένα ζήτημα που πρέπει να έχουμε κατά νου, ειδικά αν είστε μετακινούμενος εξοπλισμός μεταξύ των κτιρίων μέσα σε ένα παράθυρο συντήρησης μη εκπληκτικό χρονικό πλαίσιο.

MTBF: Μπορεί να αποτύχει πάρα πολύ

Όσο χρήσιμος όσο οι προβλέψεις MTBF είναι σημαντικοί για τον υπολογισμό των επιπέδων του αποδεκτού κινδύνου με κάθε εξοπλισμό στον οποίο πρέπει να βασίζεται μια επιχείρηση. Δυστυχώς, ακόμη και με όλες τις στατιστικές διαβεβαιώσεις που παρέχονται από τους κατασκευαστές, ο μόνος συγκεκριμένος τρόπος για να εξασφαλιστεί η διαθεσιμότητα του εξοπλισμού που τρέχει κρίσιμα συστήματα είναι ο διπλασιασμός του για να επιτρέψει μια αναστολή του χρόνου αναμονής.

Κάθε μεμονωμένο κομμάτι υλικού που χρησιμοποιείται στην επιχείρηση αποτελείται από πολλά διαφορετικά στοιχεία, οπότε το πραγματικό MTBF απέχει πολύ από έναν ασήμαντο υπολογισμό. Είναι σαφές ότι το κριτικό του να μην ξεκουραστεί ένα μέλλον των επιχειρήσεων σε αυτές τις μετρήσεις πιθανότητας αλλά να τις χρησιμοποιήσει ως κριτήριο για να λάβουν τεκμηριωμένες αποφάσεις σχετικά με τις διαδικασίες συνέχισης των επιχειρήσεων και ανάκτησης καταστροφών. Εξάλλου, η μείωση του χρόνου διακοπής μέσω ενός σχολαστικού προγραμματισμού εκ των προτέρων μπορεί να σημαίνει τη διαφορά μεταξύ επιτυχούς επιχείρησης και επιχειρηματικής αποτυχίας.