Servidores sem garantia - Alto risco para a continuidade do negócio

Publicado a 2/28/2014 por Knowledge Inside em Opiniao
image

O grau de importância dos serviços disponibilizados por um sistema determina a criticidade do servidor que os suporta. É legitimo, para serviços não críticos, destinarmos servidores menos robustos ou fora de garantia.

Neste artigo, não nos preocupamos com os servidores e serviços não críticos. A narrativa é direcionada aos sistemas que quando indisponíveis causam transtornos e prejuízos mesuráveis para a continuidade do negócio. Servidores que asseguram serviços que não devem estar indisponíveis vários dias a aguardarem uma reposição do hardware. Servidores que quando têm problemas graves o telefone do responsável das TI toca nos minutos seguintes à falha.

Por norma a recomendação para o ciclo de vida de um servidor está em sintonia com o nível de suporte e garantia adquirido. Quero com isto dizer que se o servidor tem 3 anos de garantia e suporte, normalmente no final dos três anos o mesmo deverá ser substituído ou estendida a garantia (caso faça sentido e seja possível)*.

Os principais fabricantes de servidores habitualmente fornecem garantias e contratos de suporte especiais para as máquinas críticas. Estes contratos podem durar entre 2 a 5 anos (por vezes mais) e contemplar tempos de resposta entre as 4 horas até ao dia útil seguinte. O suporte funciona bem e é levado muito a sério pelos fabricantes de referência. Na prática e em circunstâncias normais para um contrato simples “Next Business Day”, após identificação do problema, no dia útil seguinte temos a peça a ser substituída nas instalações do cliente.

O relato que apresento nas próximas linhas é um exemplo do que pode acontecer quando uma empresa depende de um servidor sem garantia para assegurar serviços críticos:

Recebemos um pedido de ajuda de uma empresa que indicava que o seu servidor não estava operacional. O servidor disponibilizava uma aplicação que definia a produção diária de uma pequena fábrica. Estavam aflitos. Após análise, verificámos que esse mesmo servidor não só já não estava na garantia, como já contava vários anos no ativo. A avaria identificada foi a motherboard e o fabricante já não disponibilizava peças para este servidor.

Para piorar o cenário, o sistema RAID dos discos apenas é identificado com o controlador interno do mesmo que por acaso está na própria motherboard, o que inviabiliza o acesso aos dados num hardware diferente. Os backups não eram monitorizados e estavam sem funcionar há alguns meses. A solução veio pela gentileza de uma outra empresa nossa Cliente que detinha um servidor igual ao avariado e que autorizou que colocássemos os discos no mesmo para recuperar a informação.

Como sempre, a reposição dos sistemas não foi um processo linear, mas a fábrica produziu nessa madrugada com base em informação impressa a partir do dados recuperados e dois dias depois tinha o sistema normalizado num novo hardware e com backups monitorizados.

A intervenção relatada, que felizmente terminou bem, fala por si em relação à importância do tema do suporte e garantia dos servidores. O problema de mantermos operacional um servidor sem garantia, é também agravado pelo facto de as peças para o equipamento, com o avançar dos anos, deixarem de existir ou serem muito difíceis de adquirir no mercado.

Em resumo, um plano de continuidade do negócio, não deve passar ao lado deste tema que na minha opinião é essencial.

* O fim do ciclo de vida do hardware pode também ser uma ótima oportunidade para avaliar a migração dos serviços para a cloud.

Comments