O Facebook e seus demais serviços, como Instagram e WhatsApp, não ficaram apenas fora do ar na segunda-feira (4), mas também deixaram de existir para a internet.
Depois de um dia caótico, a empresa publicou uma explicação sobre a queda de seus serviços, escrita pelo vice-presidente de infraestrutura do Facebook, Santosh Janardhan. Depois de quase 7 horas fora do ar, o executivo disse que "alterações de configuração nos roteadores de backbone que coordenam o tráfego de rede entre nossos data centers causaram problemas que interromperam essa comunicação".
Facebook sumiu da internet
Mas, afinal, o que isso significa? Alberto Azevedo, CEO da empresa de segurança da informação CYB3R, afirma que o Facebook simplesmente deixou de existir.
"O Facebook não estava somente fora do ar, não era uma situação que eu estava tentando acessar o site e o servidor estava fora do ar. O Facebook literalmente saiu da internet ontem. Saiu e voltou", afirma. "A falha do Facebook foi bem complexa mesmo, e é por isso que ela foi bem grave".
Alberto explica que a internet é feita em camadas, e que o problema de ontem aconteceu em uma camada de rede, que é profunda. Cada nó de distribuição da internet se comunica com outros poucos nós, que vão se comunicando com outros, e assim por diante. "É como se fosse assim: eu conheço meus vizinhos, mas meus vizinhos conhecem os vizinhos de lá, e vai indo até que chega em uma cidade inteira", esclarece o especialista.
E para que a comunicação seja feita entre esses nós, é preciso que um servidor anuncie que determinado serviço existe. "Para que eu exista na internet, eu preciso anunciar: eu estou aqui, meus endereços são esses e eu estou nesses lugares", afirma Alberto.
Depois de um erro em uma configuração, o servidor do Facebook simplesmente deixou de anunciar que ele existia. Essa informação parou de circular entre os nós e, para o usuário final, o resultado foi a queda do serviço.
"Aquele servidor que fazia os anúncios dizendo 'eu estou aqui', dizia 'eu não estou mais em lugar nenhum'. Ele revogou todos os anúncios de onde o Facebook estava. A partir do momento que você revoga os anúncios, a internet esquece de você, é como se você não existisse mais lá", explica Alberto.
Poderia ter sido pior
O Facebook não divulgou o motivo exato que desencadeou a série de erros, mas Alberto afirma que pode ter sido algo simples, como um erro em uma tarefa cotidiana. Se alguém executou um comando errado, por exemplo, é o suficiente para que a falha acontecesse.
O problema só foi tão grave porque aconteceu em uma camada profunda da internet. "A internet tem sete camadas. Os protocolos que a gente conhece, que é HTTP, HTTPS, onde a internet de fato funciona, é tudo na camada sete. Esse protocolo BGP [onde ocorreu o erro] está na camada quatro, uma camada de rede. Ou seja, ele funciona lá embaixo".
"Geralmente, 90% dos problemas podem ser resolvidos remotamente. Agora, quando você tem um problema para resolver em uma camada de rede, você tem que estar no servidor", afirma Alberto. É por isso que o Facebook moveu equipes para seus servidores - e os funcionários ainda tiveram que lidar com problemas de acesso ao prédio porque nem os crachás funcionavam.
Diante do tamanho da falha, era possível que os serviços do Facebook voltassem ao ar com erro ou demorassem muito para serem recuperados. "O Facebook tem os melhores dos melhores trabalhando. Se você for parar para pensar na magnitude do problema, o fato de eles terem voltado em sete horas ao ar é impressionante. Se isso acontecesse em uma empresa menor, a empresa talvez ficasse até 72 horas fora do ar", avalia o especialista.