Controllo
dello stato dei sistemi
NeMO TA esercita il
controllo dello stato di funzionamento di tutti gli apparati
(sistemi, dispositivi di networking, device speciali)
collegati in rete TCP/IP mediante la specifica del loro
IP address ed eventualmente della porta da interrogare.
Lo stato di funzionamento viene sintetizzato in 4 livelli:
- Controllo UP, le operazioni di controllo sono andate
a buon fine. Associato al colore verde.
- Controllo DOWN, il controllo ha ritornato una condizione di errore.
Associato al colore rosso.
- Controllo PENDING, le
operazioni di controllo sono in corso e non ancora terminate.
Associato al colore blu.
- Controllo UNREACHABLE,
non è stato possibile sottoporre il sistema alle
operazioni di controllo, presumibilmente per problemi
di rete. Associato al colore azzurro.
Le operazioni da
eseguire per determinare lo stato di funzionamento del
sistema sono svolte dal plug-in di controllo ad esso associato
in configurazione.
Controllo dello stato dei
servizi
L'entità principale controllata da
NeMO
TA sono i servizi applicativi ospitati a bordo
dei vari sistemi. Se tutti i servizi sono nello stato
corretto, sono evitati i controlli sui sistemi che li
ospitano, risparmiando tempo e risorse. Il concetto di
servizio applicativo è estremamente flessibile
ed è realizzato mediante l'attivazione delle operazioni
di controllo su uno o più processi che lo compongono.
Lo stato di funzionamento del servizio è riassunto
dai seguenti 5 livelli:
- Controllo OK, le operazioni di controllo sono andate
a buon fine. Associato al colore verde.
- Controllo
WARNING, alcune fasi del controllo hanno rilevato un degrado
del servizio. Associato al colore giallo-arancio.
- Controllo CRITICAL, il controllo ha ritornato una condizione
di errore. Associato al colore rosso.
- Controllo
PENDING, le operazioni di controllo sono in corso e non
ancora terminate. Associato al colore blu.
- Controllo
UNKNOWN, non è stato possibile sottoporre alle
operazioni di controllo il servizio, presumibilmente per
problemi sul sistema ospite. Associato al colore azzurro.
Le operazioni da eseguire per determinare lo stato di
funzionamento del servizio sono svolte dal plug-in di
controllo ad esso associato in configurazione.
Modalità attiva/passiva
La modalità di esecuzione dello specifico controllo
di un servizio può essere attiva o passiva.
In modalità attiva è
NeMO
TA ad iniziare le operazioni di verifica dello
stato, che possono essere quindi di tipo intrusivo (tramite
un agente specializzato) o esterno (tramite i meccanismi
di comunicazione in rete nativamente offerti dal servizio).
In modalità passiva è il servizio stesso
che inizia la comunicazione del proprio stato di funzionamento.
Questa è la classica modalità utilizzata,
per esempio, per la gestione delle trap SNMP.
Plug-in di controllo
Le operazioni da compiere per verificare lo stato di funzionamento
dei sistemi o dei servizi applicativi sono svolte da un
insieme di moduli specializzati in base all'oggetto da
controllare, definiti "plug-in di controllo".
Ogni entità controllata può avere il proprio
plug-in, oppure lo stesso plug-in può essere associato
a più entità mediante parametri di attivazione.
Oltre ai plug-in già in dotazione con
NeMO
TA, ogni utente può realizzare i propri
con estrema facilità, per controllare servizi o
sistemi proprietari.
In base alle caratteristiche del servizio controllato,
i plug-in di controllo possono essere eseguiti localmente
al sistema che ospita
NeMO
TA oppure remotamente sul sistema dal controllare.
La comunicazione con NeMO TA per i plug-in eseguiti remotamente
avviene sempre via rete TCP/IP, mediante un modulo in
dotazione di comunicazione degli agenti.
Plug-in di gestione automatica
A seconda della natura dei sistemi e dei servizi controllati,
è talvolta possibile eseguire delle operazioni
di gestione in modo automatico a fronte dei vari cambiamenti
di stato, come tentare il restart di un servizio o l'invio
di informazioni ad un sistema di trouble ticketing.
NeMO TA consente di
associare, ad ogni sistema o servizio sotto monitoraggio,
un modulo che può eseguire operazioni sistemistiche
o applicative e che sono automaticamente attivate al cambiamento
di stato dell'entità controllata.
Per esempio, se il controllo sull'occupazione dello spazio
disco rileva il superamento di una soglia critica segnalando
il servizio in stato WARNING,
NeMO
TA può attivare automaticamente un plug-in
di gestione che provoca la rimozione di file inutilizzati,
tentando di recuperare la situazione.
Allo stesso tempo può invocare un plug-in di notifica
che invia una e-mail al sistemista incaricato di amministrare
il sistema interessato.
Dipendenza tra i sistemi
Per ogni sistema soggetto alle operazioni di controllo
può essere specificata la dipendenza nella topologia
di rete da un altro apparato (per esempio da un router
o uno switch).
In questo modo
NeMO TA è in grado di valutare se il fallimento di un'operazione
di controllo è determinato dal sistema verificato
o da qualche sistema di livello superiore nella gerarchia
di rete, fornendo la corretta interpretazione nella console
operatore e nell'invio degli allarmi.
Contatti per le notifiche
I vari cambiamenti di stato di sistemi e servizi possono
essere notificati ad entità esterne che ne sono
interessati.
Queste entità sono dette "contatti" e
possono avere associato il canale privilegiato di notifica
degli eventi, le tipologie di eventi ai quali sono interessati
e l'orario nel quale sono disponibili per ricevere le
notifiche.
Per esempio l'evento "Server di posta SMTP in stato
CRITICAL" potrebbe essere notificato all'operatore
A per posta elettronica se siamo in orario di lavoro e
all'operatore B tramite messaggio SMS se siamo durante
il fine settimana.
Quindi i contatti possono essere configurati in modo mirato
sulla base delle loro responsabilità e competenze.
Plug-in di notifica eventi
Gli eventuali cambiamenti di stato di un sistema o di
un servizio applicativo sono salvati nella base dati di
supporto a
NeMO TA oltre ad essere visualizzati sulla console operatore con
il proprio colore caratteristico ed un testo esplicativo
completamente configurabile.
Opzionalmente tale evento può essere comunicato
esternamente all'ambiente operativo di
NeMO
TA, per esempio a più destinatari di posta
elettronica, a un sistema di fax server o inviato come
messaggio SMS agli incaricati della gestione.
I meccanismi utilizzati per la notifica dell'evento di
cambio stato sono attivati con dei moduli detti "plug-in
di notifica" e sono personalizzabili in base alle
esigenze del contatto al quale sono indirizzati.
Ogni entità esterna che deve essere avvisata del
cambio di stato può avere il proprio plug-in di
notifica, oppure lo stesso plug-in può essere associato
a più entità mediante parametri di attivazione.
Oltre ai plug-in già in dotazione con
NeMO
TA, ogni utente può realizzare i propri
con estrema facilità, per notificare sistemi con
interfacce proprietarie.Ogni contatto inoltre ha configurato
un plug-in di notifica distinto per servizio o per sistema,
permettendo di utilizzare meccanismi di notifica diversi
in base all'origine dell'evento.
Tra i plug-in in dotazione si possono trovare i moduli
per le notifiche via SMS tramite il servizio SMS Manager
di
TAI o tramite modem
GSM collegato a
NeMO TA.
I plug-in di notifica sono sempre eseguiti localmente
al sistema
NeMO TA,
ma possono interagire via rete con processi e sistemi
remoti.
Gruppi di contatti
Ogni contatto può appartenere ad uno o più
raggruppamenti, a seconda delle loro caratteristiche operative.
I vari gruppi sono quindi associati ai sistemi e ai servizi
oggetto del monitoraggio di
NeMO
TA.
La notifica degli eventi caratteristici di sistemi e servizi
avviene per gruppi di contatti, consentendo di avvisare
automaticamente uno o più contatti dei vari cambiamenti
di stato.
Fasce orarie per il controllo
Nell'amministrazione di
NeMO
TA è possibile definire una o più
fasce orarie (per esempio: orario lavorativo 5 giorni
su 7, fine settimana, reperibilità notturna, ecc.)
con una semplice interfaccia grafica.
Nella configurazione di sistemi e servizi è quindi
possibile associare una di queste fasce orarie alle attività
di controllo da parte di
NeMO
TA.
Al di fuori della fascia oraria indicata,
NeMO
TA non esegue il controllo della risorsa associata.
Per esempio, un server gestionale di contabilità
che viene spento al di fuori dell'orario lavorativo, può
essere configurato per sospenderne automaticamente il
controllo durante il week-end, con conseguente risparmio
di risorse.
Fasce orarie per le notifche
Le fasce orarie sono utilizzate anche per definire con
un elevato livello di personalizzazione la disponibilità
dei vari contatti alla ricezione delle notifiche di eventi.
Ogni contatto ha associato una propria fascia oraria in
cui essere notificata degli eventi che gli competono.
Al di fuori di tale fascia oraria il contatto non sarà
notificato.
Questo permette di definire con estrema precisione chi
deve essere notificato, esattamente quando e per quale
servizio o sistema.
Log delle attività
di controllo e notifica
A supporto delle fasi di auditing del sistema di monitoraggio,
le attività di rilevamento dei fault, di notifica
o altri eventi notevoli sono registrati in un file di
log direttamente consultabile dall'interfaccia utente.
Agenti e manager SNMP
Appositi plug-in forniti con
NeMO
TA consentono l'integrazione dei dispositivi dotati
di agent SNMP o l'attivazione di trap verso manager SNMP
di secondo livello.
In questo modo è possibile l'utilizzo di
NeMO
TA in architetture complesse di netwrok, system
e application management, senza modifiche sostanziali
delle infrastrutture esistenti.
Gestione domini multipli
Le entità controllate (sistemi, servizi, contatti,
fasce orarie) possono essere inseriti in "domini
applicativi" tra loro indipendenti e amministrabili
separatamente.
Questo tipo di configurazione si presta ad organizzare
la postazione di monitoraggio per l'impiego in organizzazioni
con strutture articolate o in modalità Application
Service Provider.
Accesso per profilo utente
Ogni dominio applicativo ha il proprio insieme di utenti
caratterizzati da un proprio profilo di autorizzazione.
Nell'ambito degli oggetti controllati all'interno del
dominio possono essere definiti utenti con profilo di
amministratore, di configuratore o di semplice operatore
con mansioni di controllo.
Amministrazione delle risorse
Le funzioni di amministratore consentono di operare sulla
definizione delle entità da sottoporre a controllo.
In modo grafico è possibile definire tutti gli
aspetti riguardanti i sistemi da controllare, i servizi
ospitati e i relativi plug-in di controllo, i contatti
e i relativi plug-in di notifica, oltre che l'insieme
delle fasce orarie e gli utenti con i vari profili di
autorizzazione per l'utilizzo di
NeMO
TA stesso.
Inoltre in amministrazione è possibile modificare
alcuni dei valori caratteristici di funzionamento di
NeMO
TA.
Gestione della configurazione
L'operatore della configurazione ha a disposizione tutti
gli strumenti per la modifica dei parametri di controllo
di sistemi, servizi e contatti, può definire i
raggruppamenti di sistemi e contatti e abilitare o meno
le attività di controllo e notifica.
Inoltre ha la possibilità di salvare o ripristinare
le configurazioni direttamente dall'interfaccia grafica.