Самой ненадежной частью функционирования любой системы является человек. Эта истина была известна еще задолго до возникновения информационных технологий и во все времена активно использовалась политиками, разведками и управленцами всех уровней.
Если вопрос стоит о серьезном повышении надежности системы, то человеческий фактор из неё нужно убирать полностью.
Разумеется, убрать полностью человеческий фактор невозможно. Поэтому рассмотрим методы снижения его влияния на функционирование системы.
Замена исполнения ручных операций на скрипты. Это простой способ, который иногда применяется в современных компаниях. Смысл этого способа заключается в том, что все операции, которые необходимо провести на продуктивной среде, сначала записываются в виде скрипта и прогоняются через тестовую среду. После прохождения успешного тестирования, тот же самый скрипт выполняется по «боевым» системам.
Этот способ работает, разумеется, только для логической среды, и не подходит для аппаратных изменений.
Вторым важным недостатком этого способа является то, что он логически и экономически оправдан только для крупных критичных информационных систем, каждая минута простоя которых обходится компании в круглую сумму. Использование этого метода для небольших организаций нецелесообразно из соображения объемов трудозатрат на каждую операцию.
Данный способ является необходимым условием работы концепции SPE («Безопасная продуктивная среда», Safe Production Environment), о которой пойдет речь в другой статье.
Следующий способ, который вполне успешно можно применять даже в небольших организациях, это способ «четыре глаза». Он заключается в том, что каждая команда, которая должна выполниться в продуктивной среде, пишется одним человеком, но при нажатии «Выполнить» не выполняется, а передается на проверку другому человеку. Причем лучше не просто руководителю, так как руководитель может не быть техническим специалистом. Оба человека должны быть примерно равного уровня технической подготовленности. Тогда второй человек проверяет команду, и после его подтверждения уже идет выполнение на продуктивно среде. Если этот способ добавляется ещё и совместной ответственностью за ошибочные действия, то становится одним из самых эффективных способов снижения ошибок от ручных операций.
Существуют также дополнительные меры, призванные уменьшить вероятность ошибки при работе с продуктивной средой. Например, доступ в продуктивную среду только с отдельного рабочего места, выделение особым цветом консолей командной строки для продуктивных систем, и т.п.
Итого, достаточно надежной системой будет система, которая удовлетворяет следующим условиям:
- Все аппаратные компоненты имеют возможность горячей замены без останова основных функций системы;
- Все программные компоненты могут работать бесконечно долго без вмешательства человека («от внедрения до внедрения — ни одной регламентной работы»);
- Система снабжена достаточным набором индикаторов, которые своевременно предупреждают сотрудников о внештатной работе какого-либо узла системы;
- Любые ручные операции в работе системы, если они необходимы, оформляются и согласовываются по штатным процедурам, и проводятся в соответствии с вышеперечисленными принципами работы на продуктивной среде.