5 A kritikus berendezés meghibásodásának figyelmeztető jelei

Szerző: Judy Howell
A Teremtés Dátuma: 25 Július 2021
Frissítés Dátuma: 23 Június 2024
Anonim
5 A kritikus berendezés meghibásodásának figyelmeztető jelei - Technológia
5 A kritikus berendezés meghibásodásának figyelmeztető jelei - Technológia

Tartalom


Elvitel:

Az állásidő csökkentése a gondos előzetes tervezés révén jelentheti a különbséget az üzleti növekedés és a visszaesés között. Ahol a kudarcok közötti átlagos idő érkezik.

Ne becsülje alá, hogy napjainkban mennyire támaszkodnak a mai vállalatok a kritikus rendszerekre. Ezért az egyetlen józan ész, hogy a vállalkozás képes felmérni a berendezések meghibásodásának kockázatát. Anélkül, hogy garantálnánk, hogy egy berendezés mikor hibásodhat meg, legalább pontos becslést kell készíteni arról, hogy az mikor nem tekinthető többé megbízhatónak.

Egy egyébként láthatatlan berendezés nem tűnik kritikusnak az üzleti vállalkozások számára, de ha egyetlen hűtőventilátor meghibásodik, a generátor feladja a szellemet, és több tízezer vagy akár százezer felhasználó számára hosszabb ideig költséges problémákat okoz, akkor rendkívül fontos, hogy meg tudja becsülni az infrastruktúrájának mely elemeit - és mikor lehet meghibásodni. Ahol a hibák közötti átlagidő (MTBF) jön be, az az eljárás, amellyel az informatikai szakemberek támaszkodnak, hogy pontosak legyenek becsléseket arról, amikor a kritikus berendezések meghibásodnak. Itt egy pillantást vetünk arra, mi végül elpusztítja a kritikus eszközök néhány általános típusát, és hogyan segíthet az MTBF a nap megmentésében.


Mi az MTBF?

Minden gyártott informatikai berendezés egyedi modellszámmal rendelkezik. Azokat, amelyek valamilyen szerepet játszanak a kritikus infrastruktúrában, MTBF-becsléssel látják el az ügyfelek. A bonyolult számítások az MTBF kidolgozása érdekében egy berendezés egy hosszú vizsgálati szakaszában zajlanak egy termékkutatás és fejlesztés során, és viszonylag specifikusak egy adott modellre.

Ha meg akarja találni az MTBF-et egy adott berendezéshez, akkor azt a gyártó által szállított részletes specifikációs lapon találja meg. A gyártóval közvetlenül is kapcsolatba léphet.

útvonalválasztás

A vállalati szintű útválasztó számos részből áll, néhány mozgó és mások statikus. Az áramellátó egységeknek (PSU) és a hűtőventilátoroknak mozgó alkatrészeik vannak, és azoknak az elemeknek a meghibásodási pontjai vannak, főleg, ha az egység nem helyezkedik el egy viszonylag pormentes adatközpontban. Szerencsére néhány adminisztrátor bevitele után a legtöbb útválasztó jelentést tesz a SysLog eszköz, így minden meghibásodott összetevő megjelölhető.


kapcsolók

Hasonló módon a vállalati hálózaton belül a következő szint a kapcsoló hardver. Noha a vállalati szintű kapcsolók szintén a ventilátorokra támaszkodnak, általában kevesebb ilyen, mint a router házában. Ha a ventilátorok forgó mechanizmusai érintetlenek, akkor a hibás kapcsoló általában rosszul működik a szoftver szintjén, akár váratlanul letiltja a kapcsolóportot, vagy általában szokatlan viselkedést mutat, például csomagokat dob, különféle forgalmi zavarokat okoz, vagy helytelenül változtat. felhasználó által megadott beállításokat anélkül, hogy erre fel kellene kérni.

A Cisco hálózatépítő behemoth hirdeti egyik útválasztóját, amelynek MTBF-je 188 574 óra a Cisco Catalyst 3750G-24TS modellnél. Ha ezt elosztjuk 8 765 81277-vel (az egy órák száma egy évben), akkor látjuk, hogy ennek a modellnek az MTBF-becslése körülbelül 21,5 év. Ez a szám bizonyos megnyugtatónak bizonyul, ha figyelembe vesszük, hogy ennek a berendezésnek hibátlanul, egész nap 24 óráig teljesítenie kell, bár a valóságban ez valójában csak megbízhatóságának jelzése. Ennek ellenére képzett kitalálást ad a felhasználók számára arról, hogy az adott berendezés milyen hosszú ideig tarthat.

Rugalmas teljesítmény

Számos elemhez csatlakoztatott szünetmentes tápegységek (UPS) biztosíthatnak tartalék energiát a vállalkozáson belül a rövid időtartam alatt, mielőtt a generátorok felrobbannak az áramkimaradás során. Bizonyos speciális szoftverhibák az UPS-en belül megvalósulhatnak, mint bármely más készüléknél, de általában a legnagyobb aggodalomra az akkumulátorok képesek, amelyek táplálják őket. Ha egy UPS akkumulátort gyakran lemerülnek és újratöltik, akkor az kapacitása gyorsabban csökken, és működési ideje drámaian lerövidül. Nem meglepő, hogy az UPS akkumulátorok is teljesen meghibásodhatnak. Az UPS jelenthet modemken és hálózatokon keresztül, amikor hibák merülnek fel, de gyakran az idősebb UPS-k hangos riasztásokat indítanak, amikor egy probléma merül fel.

Nincsenek hibák, nincs stressz - Az Ön életét megváltoztató szoftverek készítésének lépésről lépésre történő leírása az élet megsemmisítése nélkül

Nem javíthatja a programozási képességeit, ha senki sem törődik a szoftver minőségével.

Védett tárolás

Az általunk használt merevlemezek, amelyekre ilyen nagy mértékben támaszkodunk, az elmúlt évtizedben jelentősen megbízhatóbbá váltak. Ezek azonban messze nem tévedhetetlenek, és attól függően, hogy melyik tanulmányt gondolná Önnek, úgy tűnik, hogy sok tényezőtől függően hosszabb ideig működnek megfelelően. (Erről nagyszerű vélemény található itt: A Remarketer.) Ha a részletes jelentés engedélyezve van, és a meghajtó visszajelzést ad a hibákról, akkor a sérült szektorok és az olvasási / írási hibák jelentik a kullancsot a tároláshoz tartozó lemez leképezésekor. kudarcot vall. Egy másik általános probléma a RAID-vezérlőhöz csatlakoztatott több lemezt használó szervereknél az, hogy maga a vezérlő meghibásodik. Sajnos a merevlemezek néha figyelmeztetés nélkül abbahagyják a működést - ezt a kérdést nehéz megbízhatóan megakadályozni.

szerverek

A kiszolgálókba épített meghajtók és a mozgó alkatrészek, például a fent említett hűtőventilátorok és PSU-k mellett, számos probléma merülhet fel a szerver hardver alkotóelemeiben is. A szoftverszinten történő jelentéstétel (amely rendszerint a BIOS-ra vagy más alacsony szintű hardverkomponens-diagnosztikára utal) kulcsfontosságú a foltozáshoz, amikor a dolgok kudarcot vallottak, vagy ami még fontosabb, a kudarc jeleit mutatják. Az egyik kérdés, amely nem feltétlenül azonnal nyilvánvaló, az, amely érinti az alaplapokat. Teljes értelme, hogy a gépek nem szeretik a túl sok hőt. De még ma is, ha egy modern áramköri lapot gyorsan hőveszteségnek vetnek fel, vagy ha nagyon melegen fut, és hirtelen hidegssé válik, repedések jelentkezhetnek, és az áramköri lap katasztrofálisan meghibásodhat. Ez a kérdés, amelyet szem előtt kell tartani, különösen akkor, ha felszereléseket mozgat az épületek között karbantartási ablakon belül, megbocsáthatatlan időkereten belül.

MTBF: Ez is sikertelen lehet

Ugyanolyan hasznos, mint az MTBF előrejelzései fontosak az elfogadható kockázatok szintjének kiszámításához minden olyan berendezéssel, amelyre az üzleti vállalkozásnak támaszkodnia kell. Sajnos, még a gyártók által biztosított statisztikai biztosítékok mellett is, a kritikus rendszereket üzemeltető berendezések rendelkezésre állásának garantálása az egyetlen konkrét módja annak megduplázása, hogy lehetővé váljon az időtúllépés.

A vállalkozásban használt egyes hardverek sok különféle alkatrészből állnak, tehát az igazi MTBF messze nem egy triviális számítás. Nyilvánvaló, hogy kritikus nem az, hogy a valószínűség ezen mérésein nyugvó üzleti jövőt nyújtson, hanem inkább mérföldkőként használja fel az üzleti folyamatosság és a katasztrófa utáni helyreállítási eljárásokkal kapcsolatos megalapozott döntések meghozatalához. Végül is az állásidő csökkentése a gondos előzetes tervezés révén jelentheti a különbséget a sikeres vállalkozás és az üzleti kudarc között.