Что это такое и с чем его едят: зачем вам аварийное восстановление системы?

18.01.2018

Аварии или сбои в работе ИТ-инфраструктуры компании могут произойти в любой момент, и этот момент - самый неподходящий. К сожалению, многие либо не верят в то, что авария произойдет именно с ними, либо думают, что обладают всеми средствами защиты.

Аварии происходят по разным причинам: повреждение линий передач электрической сети, сбои в работе оборудования, деятельность хакеров, банальное заражение вредоносным ПО или человеческий фактор – все это причинит вред и остановит работу предприятия на неопределённый срок. Незапланированные перебои в центрах обработки данных могут стоить бизнесу сотни тысяч за час, а среднее время приостановки работы компании составляет 18 часов до полного восстановления.

Хорошей новостью является то, что существуют решения, помогающие защитить ИТ-систему любого масштаба в случае возникновения проблем, и одно из них – грамотное выстраивание плана восстановления ИТ-инфраструктуры (англ. Disaster Recovery Plan). План аварийного восстановления поможет защитить бизнес как в материальном, так и в нематериальном ключе: позволит свести к минимуму операционные и финансовые последствия, устранит сбои в работе оборудования и программного обеспечения, поможет сохранить репутацию перед клиентами. Благодаря программной инфраструктуре и облаку современные средства аварийного восстановления являются эффективными и финансово выгодными, поэтому они доступны для предприятий любого размера.

Ознакомьтесь с базовыми советами по внедрению решений аварийного восстановления:

1. Чтобы система аварийного восстановления работала максимально эффективно, она должна включать все возможные типы ошибок: человеческие, аппаратные, программные, сбои в сети, перебои в электроснабжении и даже стихийные бедствия. Очень часто системы аварийного восстановления сосредоточены только на глобальных авариях, однако неэффективны для более распространенных сбоев. Поэтому восстановление системы должно включать хорошо продуманные действия по устранению всех типов сбоев.

2. Из первого пункта вытекает следующий - включите в аварийное восстановление системы повседневные инструменты для работы. Это все, чем пользуются сотрудники: телефония, электронная почта, CRM, общий доступ, копировальное оборудование и т.д.

3. Для разработки грамотного плана аварийного восстановления системы выполните следующие шаги:

а) проведите инвентаризацию критически важных приложений и ИТ-сервисов бизнеса и определите тех, кто их использует (внутри и извне);

б) оцените влияние сбоев на ваши приложения и сервисы, проверьте уровень уязвимости критических приложений, определите целевую точку восстановления (RPO, Recovery Point Objective – момент времени в прошлом, на который будут восстановлены данные) и необходимое целевое время восстановления из резервной копии (RTO, Recovery Time Objective);

в) установите границы операций восстановления и возврата и объедините их в блок-схемы, а также определите разрывы, которые могут помешать успешному восстановлению системы, и создайте сценарий по их устранению.

Разработка и документирование плана аварийного восстановления гарантирует возобновление работы ваших IT-сервисов в кратчайшие сроки. Однако может появиться ряд вопросов: с чего начать? каков алгоритм действий? какое решение выбрать?

Если вы задаетесь подобными вопросами, то команда LWCOM готова помочь вам в разработке эффективного плана восстановления ИТ-инфраструктуры под задачи вашего бизнеса. Мы имеем экспертный опыт работы с предприятиями малого и среднего бизнеса, крупными компаниями и холдингами и сможем подобрать оптимальное решение.

Одним из эффективных и надежных решений, по нашему мнению, является служба аварийного восстановления Microsoft Azure Site Recovery, с помощью которой вы сможете защитить все основные ИТ-системы и обеспечить бесперебойную работу бизнес-приложений.

С полным обзором Microsoft Azure Site Recovery вы сможете ознакомиться во второй части данного поста. Следите за нашими обновлениями!

Больше информации на нашем сайте www.lwcom.ru