Restaurar um serviço rapidamente resolve o sintoma imediato, mas deixa a origem intacta. A gestão de problemas é a prática do ITIL 4 dedicada a investigar por que os incidentes acontecem, eliminando a causa para que o mesmo tipo de chamado não volte a se repetir.
O que é um problema segundo o ITIL 4
Um problema é a causa, ou causa potencial, de um ou mais incidentes. Se um servidor cai repetidamente, o problema é a razão estrutural por trás dessas quedas, algo como uma configuração de memória inadequada ou um processo que consome recursos além do esperado.
Os incidentes são o efeito visível; o problema é a origem que continua gerando esse efeito.
A gestão de incidentes busca velocidade: restaurar o serviço o mais rápido possível. A gestão de problemas busca profundidade: entender por que aquilo aconteceu e impedir a repetição.
Os dois processos às vezes competem pelo mesmo tempo da equipe, e em alguns casos a pressa em resolver o incidente apaga evidências que seriam úteis para investigar a causa raiz depois.
O sistema de chamados que mantém registros separados para incidentes e problemas evita essa perda de informação, preservando o histórico necessário para a investigação mesmo depois que o incidente já foi resolvido.
Como identificar quando um incidente deve gerar um problema
Nem todo incidente justifica a abertura de um chamado de problema. A prática de gestão de problemas é acionada principalmente em duas situações:
- Incidentes recorrentes do mesmo tipo, onde o padrão de repetição indica que existe uma causa estrutural não resolvida, mesmo que cada ocorrência individual tenha sido contornada rapidamente.
- Um incidente único, mas de alto impacto, onde a gravidade do evento justifica investigação profunda imediata, independentemente de já ter se repetido antes.
Sem dados consolidados, a recorrência fica invisível até que alguém perceba por acaso que o mesmo tipo de chamado está aparecendo com frequência alta demais para ser coincidência.
Os relatórios segmentados por categoria de um sistema de chamados ajudam a identificar esses padrões de forma proativa, antes que a recorrência se torne óbvia o suficiente para chamar atenção sem análise de dados.
As etapas da gestão de problemas conforme o ITIL 4
O processo de gestão de problemas segue um ritmo de investigação que exige tempo e análise, diferente do ritmo acelerado da gestão de incidentes.
- Identificação do problema: parte da análise de incidentes recorrentes ou de um incidente grave isolado, geralmente alimentada diretamente pelos dados da gestão de incidentes.
- Investigação da causa raiz: usa técnicas de análise específicas para chegar à origem real do incidente, não apenas ao sintoma mais visível.
- Registro de erro conhecido: quando a causa raiz é identificada mas não existe solução imediata disponível, o problema é documentado com ações de mitigação listadas enquanto a solução definitiva não é implementada.
- Resolução definitiva: a correção da causa raiz é aplicada, geralmente em coordenação com a gestão de mudanças, garantindo que a alteração no ambiente seja feita com controle adequado.
A base de conhecimento integrada ao sistema de chamados é o lugar natural para documentar erros conhecidos, permitindo que a equipe de incidentes consulte soluções de contorno enquanto a resolução definitiva está em andamento.
Por que equipes separadas fortalecem a gestão de problemas
Uma prática recomendada pelo ITIL 4 é manter responsáveis distintos para gestão de incidentes e gestão de problemas, mesmo em equipes pequenas.
A urgência do primeiro processo tende a engolir o tempo de análise que o segundo exige, e quando a mesma pessoa acumula as duas responsabilidades, a investigação de causa raiz costuma ficar sempre para depois.
Isso não significa necessariamente duas equipes diferentes em operações menores, mas sim papéis e tempos distintos: o técnico que resolve o incidente registra o que fez, e periodicamente alguém revisa os incidentes recorrentes com tempo dedicado à investigação, sem a pressão do chamado aberto puxando a atenção de volta para a urgência do momento.
Como o Milldesk sustenta a gestão de problemas na operação
Estruturar a gestão de problemas exige dados consolidados de incidentes e um espaço dedicado para registrar a investigação, separado do fluxo de urgência do dia a dia. O Milldesk oferece essa estrutura:
- Categorização que separa incidentes de problemas, preservando o histórico de cada ocorrência sem misturar os dois tipos de registro na mesma fila de prioridade.
- Relatórios por categoria e recorrência, permitindo identificar quais tipos de incidente aparecem repetidamente e merecem investigação de causa raiz.
- A base de conhecimento documenta erros conhecidos e soluções de contorno, dando à equipe de incidentes acesso imediato enquanto a resolução definitiva está em andamento.
- O workflow visual permite configurar um fluxo específico para chamados de problema, com etapas de investigação distintas do fluxo ágil de incidentes.
- Histórico completo vinculado por categoria, dando à equipe responsável pela investigação acesso a todas as ocorrências anteriores do mesmo tipo de incidente.
Perguntas frequentes
- O que é um problema no ITIL 4?
É a causa, ou causa potencial, de um ou mais incidentes. Enquanto o incidente é o efeito visível, o problema é a origem estrutural que continua gerando esse efeito. - Quando um incidente deve gerar um chamado de problema?
Principalmente em duas situações: quando o mesmo tipo de incidente se repete com frequência, ou quando um incidente isolado tem impacto alto o suficiente para justificar investigação imediata. - O que é um erro conhecido na gestão de problemas?
É o registro de um problema cuja causa raiz já foi identificada, mas que ainda não tem solução definitiva implementada. Inclui ações de mitigação enquanto a correção não é aplicada. - Por que separar a equipe de incidentes da equipe de problemas?
Porque a urgência da gestão de incidentes tende a engolir o tempo de análise que a investigação de causa raiz exige, fazendo a investigação ficar sempre em segundo plano quando a mesma pessoa acumula os dois papéis. - Como identificar incidentes recorrentes sem depender de percepção manual?
Por relatórios segmentados por categoria que mostram a frequência de cada tipo de chamado, revelando padrões de recorrência antes que se tornem óbvios.

