di Concetta Ferruzzi e Daniele Frongia
Oggi la complessità dei sistemi informatici e dell’interazione tra i vari componenti software impone alle aziende una maggiore attenzione sull’importanza della prevenzione e della gestione degli inevitabili disastri informatici.
Sulla base della letteratura e delle esperienze maturate è possibile redigere una sorta di check list delle cose da fare e soprattutto non fare se si verifica un disastro informatico.
Supponiamo che una nota compagnia aerea, dopo un anno di lavori, metta in produzione il nuovo sito, la principale piattaforma del suo business (biglietteria online, collegamento con i partner, etc), annunciato in pompa magna da una campagna pubblicitaria world wide sui media, oltre che sul Web e sui social network.
Sempre nel nostro caso ipotetico, immaginiamo che poche ore dopo il lancio trionfale, quando i visitatori diventano decine di migliaia, il sito vada improvvisamente giù…e che un misterioso messaggio di errore compaia al posto della home.
Le conseguenze sarebbero immediate: sui social network inizierebbero rapidamente a comparire messaggi e commenti ironici sull’azienda (“non siete nemmeno capaci di fare un sito, figuriamoci di far volare un aereo”), le aziende collegate (agenzie di viaggio, servizi di biglietteria online) che usano il sito sarebbero costrette a bloccare le proprie attività e i costosissimi passaggi pubblicitari si trasformerebbero in enormi boomerang. Inquietanti scenari di disastro si abbatterebbero sul top management e sulle quotazioni in borsa.

Che fare? E’ chiaro che un’azienda che si trova ad affrontare una situazione di crisi senza precedenti rischia conseguenze negative molto rilevanti. Sono quelli i momenti in cui un Chief Information Officer (CIO) si vede passare tutta la vita davanti e maledice il giorno in cui ha intrapreso questa carriera. Ma non è certo questo il momento delle crisi esistenziali. In queste situazioni occorre rimboccarsi le maniche e risolvere il problema il prima possibile e in modo stabile. Ne va dell’immagine dell’azienda e, molto probabilmente, della sua carriera.
Cosa fare per gestire e superare la crisi
Prime valutazioni (rescue remedy)
Nell’ipotesi in esame siamo nel caso di un disastro di natura informatica.
La prima cosa da fare in questi casi è: non farsi prendere dal panico e soprattutto non alimentare il panico.
La gestione dell’ansia (e quindi la sua tollerabilità) passa attraverso la consapevolezza e il “fare” una serie di cose: il piano di crisi, che vedremo tra poco, è quindi il rimedio più efficace per tenere a bada l’ansia.
Il primo step è un’analisi preliminare del problema per comprenderne la natura. Prima di tutto, uno sguardo in sala macchine: server e data center sono in ottima forma. La causa sembra dunque essere il software. Le prime domande che si pongono gli informatici sono: un attacco informatico? Un virus? Un errore di configurazione? Un’incompatibilità tra l’applicativo e i sistemi sottostanti? Un codice poco robusto per sopportare lo stress di migliaia di utenti contemporanei? Oppure?
Caos, ovverosia il brainstorming iniziale
Il secondo step riguarda la definizione delle modalità di soluzione della criticità. E’ opportuno, in questi casi, dopo un primo momento di comprensibile caos e spaesamento, che il CIO definisca e illustri un percorso da intraprendere per superare la crisi.
Sicuramente andrebbe organizzata una riunione di crisi in cui ipotizzare possibili cause e quindi possibili soluzioni. Questo caos non è fine a se stesso, è un’importante fase di brainstorming necessaria a definire un piano della crisi.
Se un’ipotesi sembra molto verosimile (ad es. i messaggi di errore indicano una configurazione non corretta del web server), prima ancora di definire il piano è possibile un intervento d’urgenza volto a risolvere il problema “al volo”. Ma questa fase deve essere limitata nel tempo e governata dal CIO.
La task force per la gestione della crisi
L’obiettivo è chiaro: trovare nel minor tempo possibile una soluzione stabile.
Come è ovvio, non esiste una ricetta unica per raggiungere questo obiettivo. In molti casi è utile costituire una unita di crisi che comprenda tutte le risorse umane che porteranno a termine le operazioni di ripristino. L’unità dovrebbe essere coordinata dal CIO o da un suo diretto collaboratore all’altezza della situazione.
La composizione del gruppo dovrebbe prevedere le seguenti figure professionali:
- Un responsabile incaricato dal CEO o dal CIO (o il CIO stesso): questa figura diventa il commander-in-chief della crisi;
- Staff IT: Progettisti e sviluppatori, esperti database, sistemisti, esperti di sicurezza e team leader;
- Il Chief Risk Officer, se la figura è prevista dall’azienda, o un suo incaricato;
- Un’ombudsman (un uomo che funge da tramite) per i rischi IT: una figura dirigenziale rispettata e autorevole per il personale IT, al quale rivolgersi per esprimere le proprie idee e preoccupazioni sulle attività dell’unità di crisi.
- Una persona dell’area Comunicazione e Marketing;
- Una persona dell’area Organizzazione, esperta di analisi dei processi, descrizione delle procedure e verifiche di auditing;
- Eventuali consulenti ed esperti esterni.
E’ inoltre necessario allertare l’area Amministrativa affinché possa procedere ad eventuali acquisti da effettuare in condizioni di emergenza.
E’ indispensabile che nell’unità non ci siano persone che deambulano senza meta e senza obiettivi (con un’importante eccezione: i capi possono farlo, possono aggirarsi nel gruppo, per captare qualche aggiornamento, ma senza disturbare i lavori e trasmettere ansia).
Su un documento condiviso o semplicemente su una lavagna è bene indicare i numeri di telefono e l’ubicazione di ciascun componente del gruppo. Se vengono fatti dei turni, anche le fasce di presenza e reperibilità.
Comunicazione in tempo di crisi
La comunicazione interna ed esterna è essenziale. Serve a non alimentare il panico, a dimostrare che la situazione è sotto controllo, a rassicurare gli interni e soprattutto l’esterno per evitare danni troppo pesanti sull’azienda. Devono essere presidiati i seguenti profili di comunicazione:
- Interna al gruppo dell’unità di crisi: devono sempre essere chiari ruoli, attività, esiti delle operazioni e scadenze;
- Interna all’azienda: anche i dipendenti che non partecipano all’unità di crisi devono essere correttamente informati;
- Esterna: va definito un accurato piano di comunicazione con gli utenti, i media, i clienti e va posta particolare attenzione alla cura dei profili aziendali sui social media.
Diario della crisi
E’ consigliabile che venga aggiornato un diario della crisi ove riportare, con cadenza giornaliera, tutte le attività e le decisioni intraprese. Questo diario sarà estremamente importante sia durante la crisi (se ha una durata di diversi giorni può essere utile recuperare informazioni pregresse) che dopo, per analizzare l’accaduto e farne tesoro.
In questo diario andrebbe specificata, per ciascuna ipotesi di lavoro, la procedura seguita, le risposte del sistema, le decisioni anche minime prese.
Gestione del team (ovverosia di un gruppo di esseri umani)
Il responsabile dell’unità deve provvedere ad allestire un’area di ristoro (cibi e bevande) per il personale impegnato nell’unità. Qualche extra (cioccolatini, salatini, etc; mai alcolici, se non per brindare alla fine) può contribuire ad allentare la tensione e a strappare qualche sorriso.
Tra le responsabiltà del capo c’è anche quella di assicurare il massimo confort al team, e quindi una volta istituita l’unità è bene chiarire i turni del personale e assicurare adeguate pause a tutto il gruppo. E si, anche il super tecnico che-sembra-sempre-indispensabile deve potersi riposare, perché anche lui, nonostante le apparenze, è un essere umano.
Riunioni periodiche
Durante la crisi l’email diventa uno strumento da utilizzare con cautela: meglio la messaggistica istantanea. Le riunioni devono essere fatte con il contagocce, meglio per sottogruppi e se possibile in modalità stand-up, preferibilmente periodiche, ad esempio ogni giorno un breve briefing alle 12 e alle 19, in analogia al modus operandi dei team investigativi. Chi conosce i romanzi di Mankell sa che le riunioni efficaci, di cui parleremo in un successivo post, sono decisive per il successo di un’indagine o di un progetto.
Dopo la crisi
La fine della crisi
La conclusione della crisi passa attraverso alcuni passi tra cui:
- Diagnosi e risoluzione del problema e conseguente brindisi.
- Test: prima di tornare online, l’azienda deve eseguire accurati test sia internamente che esternamente (con un campione di utenti). Sbagliare una volta può succedere, due volte non è consentito.
- Monitoraggio della messa in produzione: il secondo “varo” diventa più importante del primo, e quindi va necessariamente accompagnato da tutto il personale dell’unità, con compiti ben precisi e tracciabili.
- Reportistica accurata di quanto accaduto: è necessario che tutte le ipotesi valutate e le soluzioni adottate siano ben documentate. Il diario della crisi dovrà quindi essere elaborato e diventare un documento ufficiale.
- Comunicazione delle soluzioni adottate e condivisione della conoscenza acquisita nella gestione delle problematiche emerse sia internamente che esternamente.
Sopravvivere a una crisi
In alcuni casi il danno provocato da una crisi può essere enorme.
A livello aziendale il ruolo della comunicazione nel ridare vigore all’immagine aziendale con campagne ad hoc è essenziale. Occorre poi ricostruire i legami con le aziende partner eventualmente danneggiate.
A livello individuale appare saggio adottare delle regole per sopravvivere alla crisi:
1) rispetto di sé, cioè voler vivere e non soltanto sopravvivere; 2) intensità, cioè proiettarsi sul lungo termine; 3) empatia, in ogni crisi mettersi al posto degli altri; 4) resistenza, cioè pensare a creare piani alternativi; 5) creatività, cioè se la crisi diventa irreversibile, imparare a trasformarla in un’opportunità; 6) ubiquità, cioè prepararsi a cambiare radicalmente e imparare a essere mobili; 7) pensiero rivoluzionario, ossia osare il tutto per tutto.
In altre parole, quando la crisi sarà superata lascerà una scia di innumerevoli vittime, ma anche qualche vincitore. Ciascuno di noi può anche uscirne meglio di quanto immaginato se si riescono ad adottare efficaci strategie di sopravvivenza personali.
Per evitare nuove crisi
Una crisi è un importante campanello di allarme. Sarebbe utile approfittare della crisi per una verifica della funzionalità complessiva del sistema e di tutte le sue componenti hardware e software, nonché dei vari protocolli di intervento.
Andrebbero infatti specificate in maniera dettagliata tutte le procedure operative e le possibili risposte nel caso si verificassero degli errori e delle anomalie. Una sorta di manuale di istruzioni per l’uso del sistema che consenta di andare al di là della conoscenza diretta del sistema stesso permettendo l’intervento di soluzione di eventuali problemi anche ai tecnici che non hanno fatto parte del progetto.
Va quindi fatta una sorta di mappa delle cose da fare, di catalogo dei rischi, di piani B e C per fronteggiare eventuali crisi future con l’indicazione dei responsabili e degli indicatori di riferimento.
La lezione imparata
Il proverbio è ormai noto da tempo: le nozze con i fichi secchi non si fanno; se il progetto del nuovo sito non ha seguito una buona conduzione, se non sono state allocate risorse a sufficienza, se non si è fatto in tempo a testare il sistema, è bene capire che il matrimonio può durare molto poco. Anche pochi minuti. Ecco allora che CEO e CIO, se sopravviveranno alla furia vendicativa degli azionisti, dovranno rivedere profondamente le modalità di gestione dei progetti IT, con particolare attenzione a quelli mission critical.
Tuttavia, come dicevamo all’inizio, non tutto si può prevedere (la lista di disastri informatici dell’ultimo decennio la dice lunga) e allora è importante sapere come affrontare una crisi.
Altrimenti la legge di Murphy (se ci sono due o più modi di fare una cosa, e uno di questi modi può condurre ad una catastrofe, allora qualcuno la farà in quel modo) è sempre in agguato.
In particolare, dopo una crisi, è bene fare in modo di non ritrovarsi nella condizione descritta sempre da Murphy: le esperienze fallimentari passate non rendono più saggi e accorti, ma solamente più rintronati.