Как разобраться в отказоустойчивости дата-центра

 

Как разобраться в отказоустойчивости дата-центра

Отказоустойчивость дата-центров традиционно определяется уровнем надежности Tier. Но стандарт Tier не регламентирует все аспекты деятельности центра обработки данных, поэтому ориентироваться только на Tier III и коэффициент отказоустойчивости 99,982% не стоит. А на что стоит?

Коэффициент отказоустойчивости и временной период

Допустим, после операции коронарного шунтирования пациенту обещали доступность сердца 99,98%, на первый взгляд это кажется неплохим результатом. До тех пор, пока не соотнести 99,98% с месячной нормой сердечных сокращений: при SLA сердца 99,98% из нормы 2 592 000 сокращений в месяц у пациента выпадают 0,02%, что составляет 518 пропущенных ударов или 8 минут нерабочего состояния.

Ничего страшного, если эти пропущенные удары и минуты равномерно распределятся по 30 дням месяца. А если 8 минут простоя сердца случатся единовременно? Остановка сердца, мозговая кома, летальный исход.

Именно поэтому важно понимать, за какой период ЦОД считает коэффициент отказоустойчивости. В SLA GreenBushDC, например, указан годичный период — 99, 98% общей доступности сервиса в год. У других ЦОД это временной диапазон может быть другим — нужно спрашивать и считать.

Среднее время восстановления

Показатель общей доступности ЦОДа напрямую зависит от среднего времени восстановления. Эта метрика определяет усредненное время, необходимое на восстановление системы после сбоя. Сюда включается время на диагностику, прибытие специалиста и ремонт непосредственно на месте. Как вы понимаете, минимальным этот показатель будет, если на складе всегда в наличии запасные части и расходники, и если служба эксплуатации обладает навыками и компетенциями, необходимыми для ремонта. Очень много «если» и о них обязательно нужно расспрашивать отдельно.

Плюс к требованиям Tier

Требования Uptime Institute сосредоточены на топологии инженерных систем и детально оговаривают производительность критического оборудования. Но в них нет никаких указаний на количество камер видеонаблюдения, СКУД и физическую охрану.

{Илл.1 Контроль доступа}

Таким образом, сертификат Tier III и даже Tier IV хоть и декларирует определенную производительность, надежность и доступность инфраструктуры ЦОД, он закрывает далеко не все вопросы. Поэтому, выбирая действительно отказоустойчивый ЦОД:

  • Подробно расспросите менеджеров об общей доступности, расчетном периоде и среднем времени восстановления,

  • Поищите отзывы, причем смотрите не только на суммарный рейтинг, но и на частные оценки. Иногда дата-центру «три звезды» ставят только за многоуровневую систему безопасности и необходимость получения пропуска в машзал.

  • Расспросите о рисках, не ограничиваясь техническими вопросами. Пройдитесь по вопросам правового и организационного риск-менеджмента. Необязательно в деталях. Достаточно, если у дата-центра есть план мероприятия, позволяющий предупредить или минимизировать потери еще на стадии обнаружения.

  • Посетите площадку. В реальности все может выглядеть совсем не так, как на сайте или в презентации.

{Илл.2 Машинный зал}

При любом выборе важно учитывать не один и не два, а сразу несколько факторов. И выбор отказоустойчивого дата-центра как раз тот случай, когда лучше проверить, перепроверить, а только потом принимать решение.

 
Рубрика: Пресс-релизы
© 2014 letnews.ru — самые свежие новости. Цитирование материалов без активной гиперссылки — запрещено. Сетевое издание LETNEWS, Свидетельство о регистрации ЭЛ № ФС 77 — 67881, Дата регистрации: 06.12.2016, учредитель - Горелкин Д.О., главный редактор - Горелкин Д.О., d_gorelkin@mail.ru, 8(977)8019600. Для детей старше 16 лет.