Аварийное восстановление как услуга: преимущества и недостатки

Аварийное восстановление как услуга: преимущества и недостатки

Существует немало компаний, деятельность которых во многом зависит от непрерывности работы сервисов и приложений. В большинстве из них применяются различные инструменты и сценарии, направленные на обеспечение работы информационной системы в режиме 24/7/365. Чаще всего такие решения позволяют быстро возвращать в рабочее состояние отдельные сегменты системы за счет резервирования мощностей, а также запускать вышедшие из строя сервисы в рамках локальной инфраструктуры в случае падения отдельных хостов. Такой подход отлично работает при возникновении инцидентов, влекущих за собой выход из строя сервера или коммутатора, а также при возникновении ошибок в работе отдельных программ.

Но помимо инцидентов локального характера, которые чаще всего предусматриваются еще на этапе построения инфраструктуры, существуют также глобальные катастрофы, возникновение которых невозможно спрогнозировать, что, в свою очередь, не отменяет необходимости обеспечения непрерывности бизнеса. Вследствие подобных событий чаще всего выходит из строя вся информационная система.

Для борьбы с катастрофами используются системы аварийного восстановления (DRS – Disaster Recovery System), которые позволяют запустить необходимые сервисы на удаленной площадке в случае, когда основная выходит из строя, обеспечивая таким образом минимальное время простоя работы сервисов.

Существует два варианта реализации таких решений: построить все самостоятельно, потратив значительные временные и финансовые ресурсы, либо обратиться за помощью к облачному-провайдеру и воспользоваться услугой аварийного восстановления в облако (DRaaS – Disaster Recovery as a Service). В данной статье мы подробнее рассмотрим это решение, а также разберем, какими плюсами и минусами оно обладает.

Как все устроено

Чтобы понять преимущества и недостатки DRaaS, необходимо разобраться с тем, как эта услуга устроена и что гарантирует облачный провайдер в рамках ее работы.

Как это работает?

Итак, в рамках DRaaS облачный провайдер обеспечивает репликацию виртуальных серверов на удаленную площадку с возможностью последующего развертывания в случае аварии. По сути это означает, что актуальная копия каждого защищенного сервера постоянно находится в облаке и в случае, если инфраструктура заказчика перестанет функционировать, эти копии можно будет запустить прямо там, за считанные минуты, и продолжить работу.

Как правило, требования и ожидания DRaaS документируются в соглашении об уровне оказания услуг (SLA – Service Level Agreement), который заключается между поставщиком и заказчиком. Основными показателями такой услуги, как и в случае с резервным копированием, являются RTO (Recovery Time Objective) и RPO (Recovery Point Objective), то есть время, необходимое для восстановления в случае аварии, и тот момент, на который данные будут актуальны.

Показатель RTO зависит от количества виртуальных серверов, подлежащих восстановлению, а также от технологии обеспечения катастрофоустойчивости. Обычно время на возврат ВМ в строй после аварии не превышает двух часов, но в зависимости от требований заказчика этот параметр может меняться.

Показатель RPO зависит от того, какой из двух типов репликации применяется для копирования данных. Чаще всего облачные провайдеры используют асинхронную репликацию. Это значительно уменьшает требования к каналу передачи данных и, как следствие, конечную стоимость услуги для клиента, но увеличивает значение RPO в среднем до одного часа. Синхронная репликация практически не применяется в случае с DRaaS, так как организация выделенного канала связи для обеспечения нулевого RPO практически всегда будет нерентабельной.

Различные варианты решения

Существуют разные способы предоставления DRaaS в зависимости от используемого типа виртуализации и инструментов, с помощью которых реализовано решение.

Некоторые инструменты нацелены на работу с большим парком виртуальных серверов. В этом случае используются сценарии восстановления, которые позволяют заранее прописать правила и порядок запуска ВМ в случае аварии, а также обозначить соответствие ресурсов, таких, например, как сеть и расположение. В случае аварии пользователю достаточно нажать одну кнопку и все ВМ будут восстановлены в соответствии со сценарием. Такие решения чаще всего подходят компаниям, имеющим большой парк бизнес-критичных приложений и сервисов.

Другие инструменты рассчитаны на точечную работу и позволяют резервировать отдельные серверы. Они, как правило, просты в использовании, но имеют ряд ограничений, таких, например, как отсутствие плана восстановления. Это означает, что в случае падения основной площадки каждую ВМ надо будет восстанавливать отдельно. Это решение подходит для предприятий с небольшим количеством критичных сервисов, которым наиболее важны простота и скорость развертывания.

Плюсы и минусы

У каждого решения есть свои сильные и слабые стороны, и DRaaS исключением не является. Давайте рассмотрим плюсы и минусы услуги аварийного восстановления по сравнению с самостоятельным развертыванием DRS.

Преимущества

1. Экономия финансовых средств

Основным плюсом использования DRaaS является, конечно же, экономия финансов. При самостоятельном развертывании подобного решения помимо покупки аппаратных мощностей и программных лицензий, необходимо также организовать саму резервную площадку и её сетевую связанность с основной частью инфраструктуры. При этом дополнительно увеличится нагрузка на ИТ-отдел компании, так как удаленную площадку необходимо будет администрировать. Для многих компаний, у которых всего несколько бизнес-критичных приложений, работающих на одном хосте, развертывание собственной DRS будет просто нерентабельным. В случае использования DRaaS все эти заботы лягут на плечи облачного провайдера.

2. Возможность использования решений высокого уровня

Для многих предприятий построение полноценной DRS является невозможным в рамках собственной инфраструктуры, уровень которой в целом удовлетворяет требованиям бизнеса. При этом существует необходимость обеспечения непрерывности работы сервисов. Для таких клиентов DRaaS является идеальным решением, требующим минимальных движений и обеспечивающим необходимый результат.

3. Отсутствие необходимости обучения сотрудников

Помимо материальных затрат внедрение и поддержка DRS требует определенных навыков и знаний. Сотрудники облачного провайдера помимо высокой квалификации имеют также и опыт использования решений подобного плана. Это позволяет максимально исключить влияние человеческого фактора не только при обслуживании системы, но и при развертывании серверов в случае аварии.

Недостатки

1. Зависимость от облачного провайдера

В случае с DRaaS, как и с любой другой услугой подобного плана, очень многое зависит от облачного провайдера. Действительно, выбор поставщика является важнейшим моментом в реализации решения аварийного восстановления в облаке. Если в случае катастрофы провайдер не сможет обеспечить надлежащее качество восстановления ВМ, то для заказчика последствия могут быть очень неприятными, ведь речь идет о критичных сервисах, от которых зачастую зависит работа всей компании. По сути, этот недостаток является единственным.

Заключение

В настоящее время существует множество сценариев и инструментов для обеспечения катастрофоустойчивости информационных систем, и аварийное восстановление в облако является одним из самых востребованных. Популярность облачного подхода объясняется гибкостью условий, низкой стоимостью, а также относительно легким внедрением. Но, чтобы получить максимум результата и минимум проблем, необходимо выбрать подходящего сервис-провайдера, имеющего опыт в развертывании подобных решений и использующего для этого программные и аппаратные инструменты высокого уровня.