El término disaster recovery hace alusión a los procesos que se ponen en marcha para recuperar rápidamente la información y las funcionalidades que han quedado interrumpidas en una empresa ante una contingencia temporal provocada por un desastre natural o una intervención humana. Este plan o metodología se debe poner en marcha automáticamente y de forma sistemática ante cualquier discontinuidad del servicio que provoque la suspensión de la operativa de una empresa.
El objetivo fundamental es reinicializar los procesos críticos afectados a la mayor brevedad para minimizar sus efectos y facilitar la vuelta a la normalidad y la plena operatividad de la empresa.
Índice de temas
Importancia del disaster recovery para las empresas
En una empresa resulta imprescindible contar con un plan de disaster recovery para reducir las posibles pérdidas provocadas por estas contingencias, con el fin de garantizar la continuidad del servicio y mantener las buenas relaciones comerciales con los clientes. Los minutos son oro en el mundo empresarial y por eso reducir el lapso de tiempo en que el sistema ha estado afectado es un objetivo prioritario de los planes de recuperación ante desastres. Este tipo de sistema de protección está orientado a la continuidad del negocio y permite restablecer todos los servicios, plataformas y datos del negocio en apenas unos minutos.
¿Es lo mismo un disaster recovery que una copia de seguridad?
Lo primero a tomar en cuenta es que ambas opciones son imprescindibles si se quiere recuperar toda la información afectada ante cualquier vulnerabilidad o eventualidad. La diferencia entre ambas es que, mientras el backup o copia de seguridad permite recuperar los datos contenidos en una copia en caso de incidente, un plan de disaster recovery va mucho más allá y permite recuperar toda la operativa de la empresa a través de una metodología y un proceso sistemático.
El plan de recuperación ante desastres no solo afecta al restablecimiento de los datos y la posible información perdida en el accidente, sino que también posibilita garantizar la vuelta a la normalidad de las funcionalidades necesarias para que la empresa puede continuar trabajando.
Tipos de desastres
- Incendios, inundaciones, terremotos…
- Robos
- Errores humanos
- Fallos en el suministro eléctrico
- Errores en el sistema
- Virus, hackeos y similares
Tipos de recuperación tras errores o desastres
Google enumera una amplia tipología de planes de recuperación ante desastres muchos de los cuales son complementarios y que dependerán de la infraestructura a proteger
- Copias de seguridad: Este sistema, basado en una copia de seguridad de los datos en un sistema externo, es complementario porque no incluye ninguna infraestructura.
- Copia de seguridad como servicio (BaaS): Al igual que las copias de seguridad de datos remotos, las soluciones de BaaS proporcionan copias de seguridad de datos habituales que ofrece un proveedor de terceros.
- Recuperación ante desastres como servicio (DRaaS): Un modelo de servicio de DRaaS te permite crear copias de seguridad de tu infraestructura de TI y datos, y alojarlos en la infraestructura de nube de un proveedor externo
- Instantáneas de un momento determinado: Estas instantáneas, también conocidas como copias de un momento determinado, replican datos, archivos o incluso una base de datos completa en un momento específico. Las instantáneas se pueden usar para restablecer datos siempre que la copia se almacene en una ubicación que no se ve afectada por el evento.
- DR virtual: Las soluciones de DR virtual permiten crear una copia de seguridad de las operaciones y los datos, o incluso crear una réplica completa de la infraestructura de TI y ejecutarla en máquinas virtuales (VMs) fuera de las instalaciones. No obstante, esta solución requiere transferencias frecuentes de datos y cargas de trabajo para ser efectivas.
- Sitios de recuperación ante desastres: Son ubicaciones que las organizaciones pueden usar de forma temporal después de un evento de desastre y contienen copias de seguridad de datos, sistemas y otras infraestructuras tecnológicas.
Motivos para tener un plan de recuperación ante desastres
Mejora en la toma de decisiones
El tener protocolos de actuación establecidos ante desastres, tal y como se recogen en un Disaster Recovery Plan, agiliza la vuelta a la normalidad en las empresas ya que en cada momento se sabe lo que hay que hacer y cómo se debe hacer. Por lo tanto, los DRP facilitan la actuación de la empresa porque la toma de decisiones ya es planteada de antemano.
Menor impacto económico
El ser ágiles y conseguir reducir período de inactividad de la empresa con un Disaster Recovery Plan ayuda a que, en caso de ocurrir un desastre, la rápida actuación haga que la productividad se vea lo menos afectada posible, lo que también se traduce en un menor impacto económico.
Imagen y reputación de la empresa
El tiempo de inactividad y la pérdida de datos impactan no solo en los ingresos, sino también en la imagen de la empresa. Tanto clientes como empleados esperan que una empresa cuente con medidas de ciberseguridad adecuadas para actuar de un modo eficiente ante una situación de desastre y conseguir una vuelta a la normalidad en un tiempo mínimo da seguridad a empleados y a clientes.
El hecho de resolver ágilmente una situación de desastre da una imagen de empresa segura, eficiente y ofrece un mejor posicionamiento en el mercado.
H2 Características de un buen plan de recuperación ante desastres
- Comunicación – desarrollar y mantener canales efectivos para compartir información antes, durante y después de los desastres
- Coordinación – alinear acciones con otras partes de una organización u otra organización para prepararse y responder a los desastres
- Cooperación – trabajar con partes internas o externas que compartan el mismo objetivo (es decir, responder y recuperarse de desastres) y estrategias para lograrlo
- Colaboración – asociarse con partes internas o externas para identificar desafíos y responsabilidades para recuperarse de un desastre lo más rápido posible.
Prepara un plan de disaster recovery paso a paso
Primer paso: Definir el alcance y el objetivo
La empresa debe definir cuáles van a ser todos los elementos que van a formar parte de dicho plan y cuáles serán los sistemas, aplicaciones críticas y datos que faciliten el correcto desarrollo operativo.
Segundo paso: Diseñar las estrategias de recuperación
Deben idearse diferentes planes o estrategias para los distintos escenarios de imprevistos que se pueden presentar: fallo en el software, caída del sistema operativo o de procesamiento de datos, caída de la base de datos.
Por ejemplo, ante la caída de la base de datos, se pueden plantear tres estrategias de recuperación diferentes: infraestructura alternativa (sitio de contingencia), backup de información y cambio de ruteo de servidores.
Tercer paso: Diseñar los procedimientos a seguir para cada estrategia
El procedimiento de recuperación puede incluir diferentes pasos.
- Contactar con el equipo de desarrollo
- Realizar el respaldo extraordinario de la base de datos y el snapshot de los servidores
- Propiciar un ambiente de seguridad en la base de datos verificando que haya espacio disponible en disco
- Revisar los logs y las alertas
- Identificar y corregir problemas
- Realizar pruebas e implementar modificaciones si es preciso
- Restaurar la última versión de la base de datos
- Notificar al responsable operacional y a los usuarios.
Cuarto paso: Establecer métricas de RPO y RTO
Hay dos elementos clave:
- Recovery Point Objetive o RPO (tiempo máximo aceptable que puede transcurrir entre que se realizó la última copia de seguridad y el incidente)
- Recovery Time Objective o RTO (tiempo que un negocio precisa para recuperar sus sistemas después de una interrupción imprevista) son dos elementos clave de un Disaster Recovery Plan.
Quinto paso: Testear, revisar y mantener
Un plan de recuperación no es un documento que se confeccione una única vez para quedar en el olvido. Para que sea efectivo, es necesario actualizarlo al menos una vez al año, o bien cada vez que haya cambios sustanciales en los recursos IT.
Asimismo, es preciso testearlo anualmente para verificar que continúa siendo efectivo. Hacerlo permite no solamente detectar errores, sino implementar mejoras continuas para perfeccionar su aplicación.