Dia Mundial de Backup e o dia depois de um ataque

Hoje, 31 de março é o Dia Mundial do Backup. E essa data existe porque hoje em dia eu ainda vejo que muitas empresas continuam perdendo dados críticos. Na grande maioria dos casos essas perdas não estão relacionadas com a falta de tecnologia, mas sim por falhas de estratégia, processos e principalmente pela subestimação dos riscos.

E esses riscos não são apenas de arquivos perdidos ou servidores com problema de software. Eles envolvem falhas sistêmicas, de operação, de segurança e até mesmo de arquitetura.

Caso Real

Vou abordar um caso real que passei recentemente onde vou trazer mais detalhes não só do problema mas também como foi possível se recuperar do desastre.

O Cenário

Em um ambiente de virtualização composto por diversos clusters foi afetado por um ransomware que foi responsável por indisponibilizar uma série de servidores virtuais do ambiente. Por sorte (ou juízo) apenas um cluster foi afetado.

A Contenção

Paralelo a isso todo a equipe de segurança já começou a atuar no entendimento do incidente e na operação de contenção para que o problema não se agravasse para os outros cluster. Tendo essa etapa superada já se tinha um cenário onde já era possível iniciar as restaurações de backup.

Restore de Backup

Tendo em vista que já se tinha um ambiente seguro e controlado e com as datas dos pontos de backup que eram necessários restaurar, foi dado início as restaurações. O ponto mais importante aqui é ter a certeza que o backup esta sendo restaurado esta limpo e seguro. Depois que o ambiente se encontra seguro e resiliente de novo, não se pode colocar o ambiente em risco restaurando um servidor ou um dado que já estava infectado. Nesse casos se tem a chance muito grande de voltar a ser infectado.

Como Garantir um Restore Limpo

Soluções e backup e proteção de dados precisam conseguir garantir que o backup armazenado dentro do repositório esta limpo e sem problemas. O Veeam consegue garantir isso através do recurso de Threat Hunting. Porém além disso é muito importante que a equipe de segurança faça o trabalho em um segunda via também.

Plano de Restauração

Depois disso o plano de restauração foi iniciado. Nesse momento já era sabido que o backup estava integro e possível de restauração. Isso por que diversos pontos anteriores já haviam sido visto e revisitados. Boas práticas estavam sendo seguidas:

  • Repositório Linux Imutável e isolado
  • Teste de Restore automatizado com o SureBackup
  • Teste de Restore manual alinhado com o negócio
  • Rede de backup isolada

Com tudo isso feito as foi dado início nas restaurações. Diversas abordagens foram realizadas. Instant Recovery, restore completo das VMs, restore granular de arquivos, etc.

Conclusão

Com isso foi possível se recuperar de um desastre que poderia ter sido muito maior. No fim do dia, o valor de uma estratégia de backup não está na tecnologia implementada, nem na quantidade de jobs configurados, mas sim na real capacidade de recuperação quando tudo dá errado.

O caso apresentado deixa isso evidente: o sucesso não veio apenas da existência de backups, mas de um conjunto de decisões executadas ao longo do tempo. Arquitetura segmentada, repositórios protegidos, validação contínua e, principalmente, preparo para um cenário de crise.

Ransomware, falhas humanas e incidentes operacionais não são mais exceções. São eventos esperados, mas que você não sabe quando que vai acontecer. A diferença entre uma indisponibilidade controlada e um desastre de grandes proporções está diretamente ligada à maturidade da sua estratégia de proteção de dados.

Mateus Wolff

Meu nome é Mateus Wolff e trabalho com TI desde 2009. Sou arquiteto de soluções de proteção de dados e tenho algumas certificações como VMCE, VCP-DCV e ITIL. Participo do programa de reconhecimento Veeam Vanguard e sou ex membro do grupo Veeam Legends. Também sou líder do grupo Veeam User Group Brasil.

Você pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *