Väärinymmärretty ongelmanhallinta

Minua on viimeaikoina alkanut harmittaa aiemmin pitämäni itil-kurssit. Pahoittelut kaikille osallistujille, mutta uskoin itilin olevan oikeassa. Valitettavasti itilin tapa kuvata insidentin ja ongelmahallinta on yksinkertaisesti väärin.Olen kirjoittanut tästä jo aiemmin mutta en korostanut tätä valuvikaa riittävästi. Itilin mukaan vian aiheuttajan (root cause) etsiminen on aina ongelmanhallintaa. Jos palvelupiste (SD) ei löydä valmista ratkaisua eikä kykene palauttamaan palvelua, se heittää pallon ongelmanhallinnalle joka sitten hakee aiheuttajan ja korjaa sen.

Tässä ei ole mitään järkeä. Tuloksena on kaksi samanlaista prosessia, jotka yrittävät ratkoa samaa tilannetta. Jos esimerkiksi tärkeä järjestelmä juuttuu eikä lähde käyntiin, on pakko tunnistaa mistä vika johtuu. Tätä varten on turha käynnistää toista prosessia. Niinkauan kun vika on päällä, on kiire päästä palauttamaan palvelu ja sehän on itilin tapahtumanhallinnan keskeinen tehtävä. Huono väliaikaisratkaisukaan ei keskeytä tapahtumanhallintaa, sen voi lopettaa vasta kun asiakas on tyytyväinen saamaansa ratkaisuun. Toisin sanoen: tapahtumanhallinnan tehtävänä on tunnistaa häiriön aiheuttaja ja korjata vika tarvittaessa. Tätä ei tietenkään pidä tehdä palvelupisteen ykköstasolla, mutta juuri siksi tarvitaan kakkos- ja kolmostasot. Itil-tentissä tällä vastauksella reputtaisi, mutta se on tentin vika.

Mikä sitten on ongelmanhallinnan tehtävä, tarvitaanko sitä lainkaan?  Ongelmanhallinnan kannattaa keskittyä ennaltaehkäisevään toimintaan, joka on osa riskienhallintaa. Ns. proaktiivinen ongelmahallinta on reaktiivista riskien hallintaa. Tärkeät tuotantojärjestelmät pyritään ”proaktiivisesti” suunnittelemaan niin, että ne eivät pysähdy. Jos näin kuitenkin on päässyt tapahtumaan, pitää miettiä ”reaktiivisesti” miten katkon uusiutuminen estetään jatkossa. Molemmat näkökulmat ovat tarpeen. Tapahtuman- ja ongelmanhallinta voivat siis tutkia saman tapahtuman aiheuttajia, mutta ongelmanhallinta (riskienhallinta) tutkii sitä vasta, kun se on ratkaistu ja palvelu on palautettu. Hyvä analogia tälle on palokunnan ja onnettomuustutkinnan toiminta. Palokunta sammuttaa tulipalon ja tutkijat selvittävät palon aiheuttajan. Prosessit ovat täysin erillisiä ja tapahtuvat eriaikaan, mutta kyllä palokunnankin on usein selvitettävä missä ja mikä palaa, ennenkuin se pystyy sammuttamaan tulen. Aiheuttajan käsite ei myöskään ole yksiselitteinen. Tapahtumanhallinnan kannalta riittää, kun on löydetty sellainen aiheuttaja, jonka korjaaminen palauttaa palvelun. Ongelmanhallinta tutkii myös aiheuttajan aiheuttajaa. Tapahtumilla on usein monia aiheuttajia. Mikäli ongelmanhallinta on osa insidenttien hallintaa, se joutuu toimimaan paineen alla, eikä ehdi miettiä pysyviä ratkaisuja, joka on sen tärkein tehtävä.

%d bloggers like this: