5 najlepších postupov pre automatizáciu riadenia veľkých incidentov

Autor: Roger Morrison
Dátum Stvorenia: 27 September 2021
Dátum Aktualizácie: 21 V Júni 2024
Anonim
5 najlepších postupov pre automatizáciu riadenia veľkých incidentov - Technológie
5 najlepších postupov pre automatizáciu riadenia veľkých incidentov - Technológie

Obsah



Zdroj: Pixtum / iStockphoto

Zobrať:

Vďaka inteligentnej automatizačnej stratégii môžete rýchlejšie a ľahšie reagovať na incidenty - minimalizovať prestoje a možné narušenie bezpečnosti.

K významným incidentom v oblasti IT dochádza v rámci spoločností každý deň. Aj keď iba niekoľko z nich má titulky, udalosti, ako sú výpadky a narušenia bezpečnosti, môžu vážne ochromiť produktivitu zamestnancov, negatívne ovplyvniť vnímanie zákazníkov a čo je najdôležitejšie, viesť k stratám na výnosoch.

Pokiaľ ide o zvládnutie veľkých incidentov v oblasti IT, je najlepšie sa zamerať na dopad na podnikanie a na konečný výsledok. Podľa inštitútu Ponemon Institute boli priemerné náklady na prestoje v roku 2016 8 851 dolárov za minútu - to je viac ako 500 000 dolárov za hodinu a typické prestoje v priemere viac ako 90 minút. A to sú len okamžité náklady! Dlhodobejší vplyv, ako je poškodenie dobrého mena a opotrebenie zákazníkov, je nepredvídateľný a potenciálne katastrofický.


Aj keď sa nemôžete úplne vyhnúť všetkým závažným incidentom, môžete svoju organizáciu vyzbrojiť, aby bola čo najpripravenejšia na ich riešenie, keď k nej dôjde. Hlavnou súčasťou vašej stratégie by malo byť začlenenie automatizácie. Organizácie, ktoré maximalizujú využitie automatizácie vo svojich procesoch riešenia veľkých incidentov, dosahujú rýchlejšiu obnovu služieb a omnoho menej chýb v dôsledku ľudskej chyby. Je to z toho dôvodu, že automatizácia priamo ovplyvňuje vašu schopnosť skrátiť trvanie okna dopadu na podnikanie - alebo nákladného obdobia, v ktorom vaši používatelia a obchodné operácie skutočne cítia dopad nehody. (Ďalšie informácie o automatizácii sa nachádzajú v téme Automatizácia: Budúcnosť vedy o údajoch a strojové učenie?)

Aby ste maximalizovali výhody automatizácie, mali by ste preskúmať, ktoré činnosti sa musia vykonať počas okna dopadu, a zistiť, ako presunúť všetky ostatné činnosti pred začatím incidentu alebo po návrate podniku do normálnej prevádzky. Tu je päť užitočných spôsobov, ako začať.


1. Vypracovať a definovať proces

Definovanie procesu riadenia veľkých incidentov je o určení toho, čo sa dá naplánovať, koordinovať alebo vykonať počas incidentu. Môže to znamenať napríklad identifikáciu kľúčových členov podporného tímu podľa zručností a harmonogramu, aby ich váš servisný personál mohol zapojiť čo najrýchlejšie a najúčinnejšie. Znamená to tiež zistiť, ako odovzdáte relevantné informácie svojmu tímu, aby mohli okamžite vyriešiť problém, ako aj informovať a aktualizovať správne zúčastnené strany.

Automatizácia je rozhodujúca pre kľúčové aspekty tohto procesu. Napríklad by ste mohli automatizovať zahrnutie relevantných informácií z vašich monitorovacích nástrojov do lístkov v servisnom stredisku alebo zahrnúť informácie z servisného strediska do upozornení pre riešiteľov incidentov. Môžete tiež dokumentovať celý incident do jediného zdroja komplexnej pravdy, ktorý je prístupný všetkým. Nezabudnite, že tento proces môžete napraviť, aby ste ho napravili - nemusíte čakať na incident v reálnom svete, ktorý by otestoval váš prístup.

2. Získajte správnu infraštruktúru

V dnešnej dobe únavy pri výstrahách je dôležité, aby ste svoje tímy naďalej bombardovali irelevantnými upozorneniami a informáciami, ktoré sa na ne nevzťahujú. Použitie filtrov na vaše monitorovacie výstrahy umožní vašim tímom ľahšie zapadnúť do ihly v sena rutinného hluku. Toto je kľúčom k tomu, aby všetky vaše informácie a údaje boli skutočne použiteľné, a nielen aby sa pridali k preťaženiu informáciami.

Medzi dobré spôsoby automatizácie patrí použitie riešenia APM na prehľadávanie všetkých vašich aplikácií a systémov s cieľom proaktívne určiť hlavné príčiny v bode akéhokoľvek zníženia výkonu, a to pred tým, ako dôjde k závažným výpadkom služieb. Môžete tiež integrovať svoje monitorovacie, servisné stredisko, aplikácie na spoluprácu a chatovacie nástroje na zdieľanie bežných informácií v reálnom čase.

Žiadne chyby, žiadny stres - Váš sprievodca krok za krokom k vytvoreniu softvéru na zmenu života bez zničenia vášho života

Nemôžete zlepšiť svoje programovacie schopnosti, keď sa nikoho nezaujíma o kvalitu softvéru.

3. Presne zmerajte MTTR

Ako meriate priemerný čas na opravu (MTTR)? Zakladáte si to na celkovom čase, ktorý sú zapojené tímy IT, alebo na celkovom čase, ktorý je skutočne ovplyvnený na podnikanie? Ak je vaša odpoveď v prvom rade, mali by ste prehodnotiť meranie dopadového okna namiesto obchodnej perspektívy. Toto je omnoho presnejšia výhoda pre vaše optimalizačné úsilie, pretože vaším cieľom je minimalizovať dopad incidentov a nielen predkladať lepšiu reakčnú správu vašej tabuli. (Ak sa chcete dozvedieť viac o prestojoch a spôsobe ich riešenia, pozrite si, čo znamená stredný čas medzi zlyhaniami skutočne.)

Môžete automatizovať poskytnutím úplného prehľadu o aplikáciách, aby ste v prípade potreby mohli retroaktívne „začať hodiny“, a uchovať si úplné záznamy o svojich činnostiach a komunikácii v oblasti riešenia problémov a komunikácii na účely analýzy a auditu s cieľom zlepšiť vaše procesy.

4. Neustále informujte zúčastnené strany - ale bez prerušenia riešenia

Zainteresované strany očakávajú účinnú a včasnú komunikáciu a zároveň očakávajú, že odborníci v oblasti predmetov zostanú laserovo zameraní na riešenie problémov. Aj keď by ste mohli určiť komunikačné kontaktné miesto na monitorovanie a zapojenie podnikových používateľov, efektívnejšou stratégiou by bolo vytvorenie samoobslužnej webovej stránky s aktualizáciami stavu. Toto oprávňuje zainteresovanú stranu, aby sa preverila bez toho, aby bombardovala váš tím ďalšími hovormi. Nezabudnite pravidelne aktualizovať svoje zúčastnené strany, aby vždy dostali a vedeli, že očakávajú, najnovšiu správu o stave. Nezabudnite, že komunikácia by sa nemala zastaviť len preto, že sa služba obnovila! Je dôležité, aby zainteresované strany získali zhrnutie toho, čo sa stalo, čo sa naučili a ako možno v budúcnosti zabrániť situácii.

Automatizáciu v tomto prípade možno implementovať na vytvorenie automatickej stránky stavu v reálnom čase pre zúčastnené strany, ako aj na vytvorenie príkazov lomítka do nástroja na chat na aktualizáciu tejto stránky.

5. Zhromažďujte údaje na podporu riadenia problémov

Obnovenie služby nepredstavuje koniec správy incidentov! V skutočnosti sa niektoré z najcennejších aktivít vyskytujú v dôsledku riešenia krízových situácií. Zhromažďovaním diagnostických údajov a údajov o dopadoch a vykonaním analýzy hlavných príčin môžete vykonať úplný audit závažných incidentov, ktoré zahŕňajú zavedenie preventívnych opatrení na zabránenie podobným incidentom v budúcnosti. Okrem toho, aj keď sa znovu vyskytne rozpoznateľný incident, môžete vytvoriť definovaný postup pre to, aké druhy údajov je potrebné zhromaždiť a kroky, ktoré je potrebné vykonať, aby sa dosiahlo rozlíšenie. Týmto spôsobom sa váš tím musí jednoducho odvolať na kontrolný zoznam a zamerať sa na svoj hlavný cieľ, ktorým je obnova služby, a nie na starosti o to, čo potrebujú a kedy.

Automatizácia tu môže zachytiť a zachovať činnosti na riešenie problémov vrátane vecí, ako sú prepisy rozhovorov, v jednom systéme záznamu na analýzu. Okrem toho vám pomôže zostaviť katalóg známych incidentov alebo problémov, upevniť osvedčené postupy pre každý z nich, a teda zvýšiť rýchlosť riešenia v budúcnosti.

Na záver: Automatizujte inteligentnejšie, nie viac

Buďte opatrní, že väčšia automatizácia nemusí byť nevyhnutne lepším prístupom! Je dôležitejšie pochopiť, kedy, kde a ako prepojiť svoje IT systémy na podporu riadenia incidentov. Nechcete pridať zbytočnú zložitosť kvôli zvyšovaniu automatizácie procesov. Nezabudnite, že cieľom je čo najviac zjednodušiť a konsolidovať operácie, aby sa vaše tímy cítili oprávnené účinne riešiť problémy. Ide o inteligentnú implementáciu automatizácie s cieľom uľahčiť dobre koordinovaný súbor procesov, kvalifikovaných pracovníkov a efektívnu komunikáciu so zúčastnenými stranami, aby sa minimalizoval celkový dopad veľkých incidentov na podnikanie.