Um erro de configuração na versão global de pré-lançamento afetará Microsoft 365, Xbox e aviões por horas, segundo a empresa
A Microsoft explica por que a Black Black assumiu o serviço de computação de arroz Azure clutchless na quarta-feira (29).O problema, que durou oito horas, foi causado por um erro na configuração interna da porta de entrada no Azure (sistema que retransmite o tráfego entre os servidores da empresa ao redor do mundo).
A interrupção afetou vários produtos e serviços da empresa, como Microsoft 365, Xbox e Copilot for Security, bem como clientes corporativos que dependem do Azure para manter seus sistemas online.A empresa afirmou que o serviço foi restaurado na noite de quarta-feira, após um processo de recuperação gradual que exigiu reconfiguração e reequilíbrio de milhares de servidores.
Erro humano e uma falha de software causaram o desligamento
Segundo a própria Microsoft, o problema começou com uma alteração de configuração que cometeu um erro na porta de entrada do Azure, que transporta dados entre rotas de sistemas e redes corporativas.
Essa mudança criou inconsistências na infraestrutura global, fazendo com que alguns servidores parassem de responder e ignorassem aqueles que ainda funcionavam.
O sistema de segurança que deveria evitar alterações erradas também falhou.Um bug de software permitiu que as verificações fossem desbloqueadas.
O resultado é algo que afeta tudo, desde os aplicativos do candidato até o uso diário, como um xbox.
Falha na cadeia, um impacto global
A interrupção começou às 12h45, horário de Brasília, e se espalhou rapidamente, afetando serviços da Microsoft e de empresas que usam o Azure.O problema era visível em todo o mundo – desde plataformas empresariais e plataformas online.
Segundo o DownDetector, as reclamações chegaram a mais de 18 mil registros em todo o mundo, sendo cerca de 700 registros no Brasil, relacionadas a falhas, lentidão no acesso e dificuldades.
Os serviços Microsoft afetados incluem Microsoft 365, Xbox, Banco de Dados SQL do Azure e ferramentas corporativas como Defender, Purview e Sentinel, usadas nas áreas de segurança e análise de dados.
A interrupção também afetou grandes empresas dependentes da nuvem da Microsoft.Segundo a Reuters, a Alaska Airlines e a Hawaiian Airlines relataram instabilidade em seus sites e aplicativos, enquanto o Aeroporto Heathrow de Londres e a Vodafone sofreram interrupções temporárias.
- Microsoft superou as expectativas com crescimento recorde do Azure
- 5 mais seguros
- Armazenamento em nuvem ou físico HD e SSD: Qual é melhor?
Linha do tempo da Microsoft sem resposta
A Microsoft disse que descobriu o problema poucos minutos após o início da interrupção.Assim que as notificações ao vivo são acionadas, as equipes de engenharia começam a investigar o bug e evitam novas alterações no sistema para evitar que o bug se espalhe.O desligamento foi feito de forma gradual e controlada, para não sobrecarregar os servidores que voltam à operação.
Prazo, de acordo com a Microsoft:
- 12h45 (horário de Brasil): início da indisponibilidade, com lentidão e erros de conexão em serviços dependentes do Azure;
- 13h04: ativação de grupos internos após alerta automático;
- 14h26: Portal do Azure removido do sistema de porta frontal para reduzir o impacto;
- 14h30: Bloqueio de novos sites e início do desfile em breve da última modificação da rede;
- 15h30: Implantação Global de Configuração Fixa Configuração e tráfego entre as iniciais.
- 18h40: Microsoft registra 98% de disponibilidade global com restauração gradual.
- 21h05: Confirmação personalizada completa para a maioria dos clientes.
A empresa afirma ter mantido contato regular com clientes corporativos por meio da ferramenta Azure Service Health.E publicará um relatório final em até 14 dias, que conterá mais detalhes sobre o incidente.
