quarta-feira, 28 de maio de 2008

Gerenciamento de Incidente

O processo de Gerenciamento de Incidentes tem por objetivo assegurar, que depois da ocorrência de um incidente, o serviço de TI afetado tenha restaurada a sua condição original de funcionamento o mais breve possível, minimizando os impactos decorrentes do efeito sobre o nível de serviço ou, até mesmo, da indisponibilidade total.

O processo de Gerenciamento de Incidentes também necessita de uma forte interação com o processo de Gerenciamento de Configuração, pois para o desenvolvimento de suas atividades existe a necessidade de conhecer os Itens de Configuração (ICs) que estão relacionados aos serviços de TI. Outra fonte importante de informações é o BDEC (Banco de dados de Erros Conhecidos), na qual se encontram as informações relativas aos erros já identificados pelo processo de Gerenciamento de Problema. 

Resolver o incidente do modo mais rápido (pode ser através de soluções de contorno), minimizar a adversidade do impacto ocasionado pelo incidente, manter a comunicação entre a área de TI e suas áreas usuárias e escalonar os incidentes para os grupos de atendimento para que seja cumprido o tempo de resolução; são objetivos deste processo.
 
O processo de Gerenciamento de Incidente é normalmente executado pela Central de Serviços.

Como todo processo existem entradas e saídas. A entrada principal deste processo são os incidentes. Os incidentes podem vir de muitas fontes como usuários, equipe de operações, redes e ferramentas de monitoramento que identifiquem irregularidades nos serviços. Soluções de contornos podem ser buscadas a partir de uma base de dados de Erros Conhecidos. A Base de Dados do Gerenciamento da Configuração (BDGC) auxiliará na identificação do item de configuração (IC) relacionado ao incidente.

As atividades durante o processo de Gerenciamento de Incidentes:

1. Detecção e Registro do Incidente
2. Classificação e Suporte Inicial
3. Identificar se é uma Requisição de Serviço, se sim executar o procedimento de requisição de serviço, caso contrário seguir o fluxo.
4. Investigação e Diagnóstico.
5. Solução e Restauração.
6. Fechamento do Incidente.

Alguns benefícios que posso destacar com a adoção do Gerenciamento de Incidente: Impacto dos incidentes reduzidos (devido ao tempo de resolução), suporte ao cumprimento dos Acordos de Níveis de Serviço (SLAs), eliminação de Incidentes perdidos, melhor utilização da  equipe de suporte, melhora na satisfação do usuário e menos interrupção da equipe de suporte.

Alguns fatores críticos de sucesso que destaco: aquisição de um software que possa auxiliar no registro de informações de incidentes, um BDGC precisa ser criado antes de implementar o Gerenciamento de Incidente, uma base de conhecimento (Erros Conhecidos) para maior rapidez de resolução do incidente, a equipe da Central de Serviços deve ter um nível de conhecimento suficiente par dar o suporte inicial e estabelecer os níveis hierárquicos para escalonamento de incidentes.

Incidente é qualquer evento que não faça parte do funcionamento padrão de um serviço de TI e que causa, ou pode causar, uma interrupção do serviço ou uma redução do seu nível de desempenho.

Todos os incidentes devem ser registrados!

Posso destacar alguns indicadores deste processo, e que devem ser medidos para que se possa avaliar a sua performance:

1. Número total de incidentes, por área de negócio, departamento, natureza
2. Tempo médio para reparo (MTTR)
3. Número de incidentes resolvidos por operador
4. Distribuição de solução entre os níveis de suporte
5. Porcentagem de incidentes resolvidos com a base de conhecimento

Por experiência, se você tiver uma Central de Serviços que possa resolver os incidentes em 1o nível, aconselho a utilização de pessoas com forte skill técnico e que estes sejam treinados em técnicas de atendimento. É muito comum os usuários quererem ser atendidos pelo atendente que tem o maior skill técnico, pois geralmente é ele que consegue resolver o incidente rapidamente, fazendo com que o usuário não tenha que aguardar muito tempo para a solução do seu problema.

Algumas dicas que acredito serem muito importantes na implementação deste processo:

1. Uma implementação desta deve iniciar de forma simples, focando a necessidade de um correto registro dos incidentes e o seu encaminhamento às equipes de suporte apropriadas. Com base nestes registros podemos ir realizando um diagnóstico mais preciso, identificando os pontos que merecem atenção por primeiro.
2. Os analistas responsáveis pelo atendimento devem procurar a implementação de soluções de contorno de modo imediato, deixando a reparação definitiva para mais tarde, quando se pode programar a interrupção do serviço de TI com a área usuária, sem reflexos para o acordo de nível de serviço.
3. Deve-se criar scripts de atendimento que permitam elevar o índice de incidentes encerrados no primeiro atendimento, criando assim também, uma forma padrão de atendimento, fazendo com que exista muita pouca diferença no atendimento de todos os atendentes. Assim evitamos que os usuários tenham alguma preferência de atendentes. Também é importante no caso do incidente ser escalonado, assim a equipe de 2o nível terá uma gama de informações para iniciar o trabalho de resolução do incidente.
4. Especial atenção deve ser dada à atividade de comunicação, mantendo-se os usuários e clientes informados sobre o progresso do atendimento dos incidentes. Este contato SEMPRE deve ser realizado através da Central de Serviços. Isto é importante para que o usuário saiba que estão olhando o problema dele.


Nenhum comentário: