A Microsoft apresenta-nos o NPM (Network Performance Monitor), como uma solução de monitorização híbrida com suporte no Azure e que permite monitorizar a performance de comunicação entre vários pontos da infraestrutura de rede (Cloud e OnPremises). Auxilia na monitorização da conectividade de rede para aplicações e/ou serviços, assim como a monitorização da performance do serviço ExpressRoute.
Com esta solução, a Microsoft procura oferecer uma fórmula eficiente para deteção de problemas relacionados com o networking da infraestrutura, como são exemplo problemas de routing, “black holes” (tráfego que é descartado sem envio de qualquer notificação à origem) e outros, que escapam às ferramentas convencionais de monitorização. Para isso, a solução gera alertas e notificações assim que os limites configurados para uma ligação de rede são atingidos, auxiliando também na deteção de problemas de performance na comunicação, permitindo a célere identificação da sua origem, em determinado segmento de rede e/ou dispositivo. São três os principais focos de ação oferecidos pelo NPM:
- Performance Monitor: Permite a monitorização da conectividade de rede entre a infraestrutura na Cloud e a infraestrutura OnPremises, entre múltiplos Datacenters, escritórios remotos e entre aplicações críticas de negócio e/ou serviços.
- Service Connectivity Monitor: Permite monitorizar a conectividade para os serviços e aplicações usadas na Organização, identificar os diferentes componentes da comunicação e quais os responsáveis pela degradação do serviço. Com o desenho da rede, torna-se mais fácil identificar com exatidão onde está o problema ao longo do “percurso” da comunicação.
Com esta capacidade do NPM, é possível efetuar testes baseados em protocolos como HTTP, HTTPS, TCP e ICMP para monitorizar em tempo real ou recorrendo a histórico, e auxiliar à medição da disponibilidade e resposta dos serviços. Websites, aplicações SaaS, aplicações PaaS, Base de Dados SQL, Office 365 e CRM Dynamics são alguns dos serviços para os quais será possível monitorizar a latência na comunicação e disponibilidade dos mesmos.
- ExpressRoute Monitor: Permite monitorizar ponto a ponto a comunicação e performance entre os escritórios remotos e o Azure, ligados com recurso a Azure ExpressRoute.
Regiões suportadas para o NPM (podem ser monitorizadas redes e aplicações em qualquer parte do Globo, a partir de um Workspace alojado numa das seguintes regiões):
- West Europe
- West Central US
- East US
- East Japan
- South East Asia
- South East Australia
- South UK
- US Government Virginia
Instalação e configuração
A instalação e configuração da solução, implica a instalação dos agentes nas máquinas que servirão como nós de monitorização, e sua configuração para envio dos logs e outros dados de performance e telemetria, para um ou mais Workspaces no Azure Log Analytics.
Os agentes de Log Analytics devem ser instalados em pelo menos um nó em cada subnet de rede que se pretenda monitorizar, ou no caso de se pretender monitorizar um determinado link ou servidores com um workload critico, devem ser instalados agentes em ambos os pontos da comunicação.
Podemos escolher entre os protocolos TCP e ICMP, como o protocolo a usar para o Performance Monitor e para o Service Connectivity Monitor. Para a monitorização com o ExpressRoute Monitor, deve ser usado o protocolo TCP. Consoante o protocolo utilizado, devem ser acauteladas as regras de firewall para permitir a comunicação entre os agentes.
Como utilizar a solução
A partir do momento em que habilitamos a solução de NPM, podemos ter uma ideia geral da “saúde” da rede.
O dashboard do NPM dá-nos uma perspetiva do estado da rede da Organização, segmentado pelas seguintes categorias:
- Top Network Health Events: Listagem dos eventos e alertas mais recentes relativos à “saúde” do sistema, desde a sua ativação (sempre que um limite configurado é atingido);
- ExpressRoute Monitor: Disponibiliza um resumo do estado entre as ligações ExpressRoute que a solução monitoriza;
- Service Connectivity Monitor: Disponibiliza um resumo do estado das aplicações e/ou Serviços, para os diferentes testes criados;
- Performance Monitor: Disponibiliza um resumo do estado das ligações de rede e subnets de rede que a solução monitoriza;
- Common Queries: Contem um conjunto de pesquisas que recolhe informação da monitorização da rede, diretamente. E que podem servir de base para a customização de novas pesquisas e suporte a relatórios.
Features relevantes
Através do dashboard e da informação apresentada, é possível fazer drill down e verificar mais a fundo qualquer indicador de maior interesse (Drill Down for depth). Por exemplo, é possível seguir um alerta ou um link de comunicação em falha e identificar qual a subnet de rede ou nó responsável pela falha.
É possível verificar uma imagem no tempo, para cada vista apresentada (Network State Recorder control). Por defeito é apresentado o estado mais recente, mas é possível aceder a informação de histórico.
O acesso a gráficos que revelam tendências é também possível. A cada nível que fazemos drill down, é possível verificar gráficos para determinadas métricas, como por exemplo, perdas, latência, tempo de resposta ou utilização da largura de banda. Estes gráficos disponibilizam uma visão sobre o histórico de performance das métricas atrás referidas (Trend Charts).
Outra feature muito interessante é o Topology Map. Uma vez que o NPM identifica ponto a ponto, a topologia de rede da Organização e as rotas existentes entre a origem e o destino da comunicação, é possível aceder interactivamente a variadíssima informação sobre os nós, caminhos de comunicação, latência, etc.
O que nós dizemos
Beneficiando do potencial e escalabilidade que a Plataforma Azure da Microsoft disponibiliza, a solução Network Performance Monitor parece-nos uma excelente “ferramenta” para auxiliar o IT da Organização. Relativamente simples de instalar e configurar, a solução permite ter uma visibilidade acurada da infraestrutura de rede da Organização (Cloud e OnPremises), com recurso a dashboards interativos, gráficos, informação em real-time e histórico. Esta informação, faculta uma excelente base de trabalho para o IT, no que diz respeito ao troubleshooting e mitigação proativa de eventuais problemas ou degradação de serviço que possam existir na infraestrutura de rede, com implicações diretas no acesso aos serviços e/ou aplicações críticas ao negócio.
|