A qualidade da rede sem fio já está incluída por padrão no conceito de nível de serviço. E se você deseja satisfazer as altas demandas dos clientes, precisa não apenas lidar rapidamente com os problemas de rede que surgiram, mas também prever os mais maciços deles.
Como fazer isso? Somente rastreando o que é realmente importante nesse contexto é a interação do usuário com a rede sem fio.

As cargas de rede continuam a crescer, e isso afeta especialmente os segmentos sem fio - pelo menos por causa da abertura de sua interface. Com o crescente número de dispositivos e taxas de transferência de dados, os problemas se multiplicam ao mesmo tempo em vários níveis. No físico - muitos transmissores de sinais de rádio se afetam, mesmo que trabalhem em partes vizinhas do espectro de frequências. Logicamente, um grande número de dispositivos conectados começa a competir pelo direito de iniciar a transmissão na frequência selecionada, aumentando o atraso na entrega de pacotes para cada usuário.
Ao mesmo tempo, as expectativas de cada cliente de usar a rede estão crescendo. Um carregamento de página de 5 segundos no navegador, que há 20 anos parecia o "topo da tecnologia", não surpreenderá ninguém. Ofereça aos clientes vídeo em HD sem desbotamento.
As novas versões dos padrões de transmissão sem fio, que usam o espectro de frequência com mais eficiência, podem resolver parcialmente o problema. Cada
versão subseqüente do Wi-Fi visa implantar mais e mais redes carregadas. Mas em uma rede de larga escala, onde há mais de uma dúzia de pontos de acesso, não será possível atribuir tudo ao próximo padrão (especialmente porque os dispositivos funcionam no modo de compatibilidade com versões anteriores assim que encontrarem um dispositivo de usuário antigo). Como não consegue continuar vivendo com as ferramentas de monitoramento antigas, o ambiente de rede está ficando cada vez mais complicado.
Por que o monitoramento normal não funciona mais
O selo clássico, que ainda assombra os administradores de todas as redes, incluindo a rede sem fio, funciona exclusivamente sob solicitação. "Alarme" funcionou - nós acordamos e entendemos o que deu errado. Enquanto isso, não há "alarme", você pode limitar-se a verificar a carga nos principais componentes - dispositivos de rede e de usuário.
De acordo com esta tarefa, as ferramentas tradicionais de monitoramento e manutenção trabalham com o princípio de regras estritas e nem sempre mostram prontamente os problemas existentes, sem mencionar algum tipo de análise preditiva.
O principal problema aqui é o intervalo de coleta de dados. As informações sobre o estado das conexões de rede sem fio são coletadas a cada minuto e podem ocorrer incidentes nos intervalos entre a coleta de leituras (um ótimo exemplo são as raras explosões de carga que "paralisam" a rede). Não recebendo dados em tempo real, é muito difícil entender o que se tornou a causa raiz do problema. Isso é mau uso da cobertura da rede? Ou, talvez, interferência externa que não esteja relacionada aos negócios de forma alguma (por exemplo, a unidade militar próxima a "jogou" no ar). Não há dados em que seria possível ver a degradação gradual de certas características da rede e, portanto, localizar o problema não é tão simples. A equipe de TI precisará gastar horas extras procurando por uma "agulha no palheiro".
Mas os usuários finais percebem o problema quase imediatamente. Um erro de conexão, uma transmissão de vídeo interrompida são excelentes marcadores.
Ferramentas de monitoramento clássicas relatam a chegada de pacotes de rede. Mas eles não podem responder à pergunta de nenhuma maneira, mas se o usuário resolveu sua tarefa.
Para obter uma resposta para essa pergunta, será necessário alterar não apenas a ferramenta, mas a abordagem para monitorar a própria organização. Do trabalho de "fogo" nas solicitações (na verdade, monitorando o desempenho e a carga de um ferro específico), continuaremos controlando a experiência do usuário e identificando situações que podem levar a incidentes.
Essa transformação envolve a introdução de algoritmos de determinação de problemas mais complexos do que avisos simples quando determinados valores são atingidos. Na plataforma de inteligência de rede Huawei CampusInsight, esses algoritmos são baseados na experiência de serviço sem fio e em técnicas de autoaprendizagem.
Sob o capô CampusInsight
O Huawei CampusInsight é uma plataforma escalável para monitorar redes sem fio de vários tamanhos. Construído com base na arquitetura de microsserviço. Cada serviço é implantado em várias instâncias, cujas mensagens são distribuídas pelo barramento correspondente. Instâncias adicionais podem ser implantadas dinamicamente, aumentando o rendimento da ferramenta.
De fato, o CampusInsight coleta, analisa e exibe dados em sua interface do usuário em cinco etapas.
O primeiro e o segundo passo são o acesso aos dados (a dispositivos que fornecem sua geração) e a coleta de "leituras". Usando a captura de telemetria de streaming GPB do Google e o Syslog "tradicional" (quando possível), o Huawei CampusInsight acumula dados quase em tempo real:
- na utilização do espectro de frequências;
- o funcionamento de pontos de acesso e outros dispositivos de rede (indicadores de desempenho, número de usuários conectados, etc.);
- sobre o caminho de usuários específicos - sobre perfis de rede, sobre quem, quando e a qual ponto de acesso conectado ou não (e com quais parâmetros de conexão);
- sobre o trabalho de aplicativos de áudio e vídeo (usando o eMDI, implementado em um dos pacotes adicionais).
Para contornar as limitações das ferramentas tradicionais que usam o SNMP para coletar dados e enviar estruturas fixas, o CampusInsight foi baseado em um modelo de assinatura para os logs necessários e algoritmos de codificação e decodificação de dados.
A terceira etapa é a distribuição e o buffer - ou seja, enviando dados brutos para Kafka para distribuição em serviços de análise de nível superior.
O quarto passo é a análise. Os algoritmos de Big Data e AI ajudam a processar rapidamente dados brutos. Como resultado, certos problemas são identificados associados a:
- autenticação (protocolo Dot1x suportado) e operação DHCP;
- estabilidade e velocidade de conexão;
- interfaces sem fio;
- a operação de dispositivos individuais, incluindo “detalhes”, como problemas com PoE ou mudança de um dispositivo de banda dupla para 2,4 GHz;
- qualidade dos fluxos de áudio e vídeo - no entanto, a função é suportada apenas para SIP não criptografado ou para alguns comutadores;
- roaming entre diferentes pontos de acesso.
Os algoritmos de IA são usados para resolver alguns problemas específicos, por exemplo, para detectar interferências entre canais durante a transmissão sem fio.
A quinta e última etapa é salvar os dados em um banco de dados de coluna distribuído Druid para uso posterior.
Uma análise das informações coletadas, levando em consideração a “linha de base” construída usando os mesmos dados históricos, permite identificar “padrões de falha” típicos - determinando KPIs correspondentes a situações problemáticas e localizando problemas, sugerindo maneiras de resolvê-los. Assim, cerca de 85% de todos os problemas de rede são considerados pela ferramenta.

Os dados são apresentados ao administrador em forma gráfica, de acordo com a hierarquia ou topologia do espaço (por exemplo, o layout do escritório). Você pode criar "mapas de calor", analisar como afetou o equipamento de certas plataformas ou fabricantes, etc. É mais fácil entender o que exatamente causou o problema.

Em geral, o CampusInsight fornece várias ferramentas para classificar problemas, comparar usuários afetados, examinar dados sobre um cliente específico e até "reproduzir" eventos que antecederam o incidente para identificar rapidamente a fonte. Ao mesmo tempo, o produto também suporta o novo Wi-Fi 6, sem mencionar seus antecessores.
Estojos
O CampusInsight já foi testado na prática, embora a maioria dos casos seja encerrada pela NDA. O caso aberto mais revelador é o uso de uma ferramenta de monitoramento na própria rede sem fio da Huawei.
A rede abrange empresas nas quais cerca de 180 mil pessoas estão empregadas, das quais 80 mil pertencem à divisão de P&D (escritórios em mais de 170 países, onde estão instalados 62 mil pontos de acesso).
A implementação do CampusInsight ajudou a otimizar mais de 630 pontos de acesso, além de aumentar a eficiência da análise de incidentes em 30%.
Abaixo estão algumas situações específicas.
Exemplo 1. Falha no grupo
Os problemas de alto nível observados em um grande número de usuários geralmente resultam de erros de baixo nível. E identificar esses problemas não é tão simples. Por exemplo, em um dos escritórios, muitos clientes móveis enfrentaram dificuldades imediatamente com a autenticação, apesar das configurações corretas e da ausência de problemas com o servidor de autenticação. A visualização dos dados em diferentes níveis ajudou a identificar rapidamente que a opção era a fonte do problema e gerava muitos erros. E para corrigir a situação, era necessário apenas substituir um pedaço de cabo. A localização e a correção do problema levaram 90 minutos.
Exemplo 2. Rastreando a qualidade do roaming
A coleta de dados no caminho de um cliente específico em uma rede distribuída permite identificar problemas não óbvios de roaming. Um caso comum é quando, em certas áreas do edifício, os usuários móveis têm problemas para se conectar à rede (embora, ao que parece, o ponto de acesso correspondente esteja em ordem). Uma das fontes desses problemas pode ser a potência muito alta do ponto de acesso na sala vizinha - portanto, em vez de se conectar ao ponto mais próximo, o cliente tenta se conectar àquele que está atendendo atualmente a um grande número de usuários (caso real: conectar-se a um ponto de acesso em uma conferência no corredor quando o usuário simplesmente passa).
Para resolver o problema, às vezes é suficiente reduzir a intensidade do sinal do ponto carregado, no entanto, a identificação requer uma análise profunda dos problemas recorrentes nas salas adjacentes à sala de conferências.
Acompanhando as tendências de desenvolvimento das redes sem fio, podemos esperar que, no futuro previsível, os problemas de serviço sejam enfrentados não apenas por gigantes, cujas redes possuem milhares de pontos de acesso, mas também por empresas de médio porte, que podem estar limitadas ao trabalho incidente. Assumindo esse desenvolvimento de eventos, é lógico observar atentamente novos padrões mais eficientes e equipamentos de alto desempenho. Vale lembrar, porém, a necessária mudança de paradigma no serviço de rede, enquanto os clientes ainda não começaram a migração em massa para os concorrentes devido à qualidade do serviço.
Obviamente, um produto da classe CampusInsight no local se beneficiará mais em implantações em larga escala, mas agora uma assinatura em nuvem também está disponível para o serviço da Public Cloud Huawei local, projetada para implementações no setor de pequenas e médias empresas. Em geral, aqueles que desejam podem tentar de tudo e "torcer" agora.