Что такое горячий резерв. Виды резервирования

Представьте, что ваш дата-центр (или боевой сервер) сегодня упал . Просто взял и упал. Как показывает практика, готовы к этому далеко не все:

  • 93% компаний, которые теряли свой ЦОД на 10 и более дней из-за катастрофы, стали банкротами в течение года (National Archives & Records Administration in Washington)
  • Каждую неделю в США выходит из строя 140 000 жестких дисков (Mozy Online Backup)
  • У 75% компаний нет решений для аварийного восстановления (Forrester Research, Inc.)
  • 34% компаний не тестируют резервные копии.
  • 77% тех, кто тестируют, обнаруживали нечитаемые накопители в своих библиотеках.
В предыдущих постах (раз и два) я писал про организационные меры, которые ускорят и облегчат восстановление ИТ-систем и связанных с ними процессов компании при чрезвычайной ситуации.

Сейчас поговорим про технические решения, которые в этом помогут. Их стоимость разнится от нескольких тысяч до сотен тысяч долларов.

Высокая доступность и аварийное восстановление

Очень часто решения для высокой доступности (HA – High Availability) и аварийного восстановления (DR – Disaster Recovery) путают. Прежде всего, когда мы говорим о непрерывности бизнеса, мы имеем в виду резервную площадку. Применительно к ИТ – резервный ЦОД. Непрерывность бизнеса - это не про резервное копирование на библиотеку в соседней стойке (что тоже очень важно). Это про то, что основное здание компании сгорит, и мы через несколько часов или дней сможем возобновить работу, развернувшись на новом месте:
Значит, нужен резервный ЦОД. Какие есть варианты? Обычно выделяют три: горячий, теплый и холодный резервы.

Холодный резерв

Холодный резерв подразумевает, что есть некое серверное помещение, в которое можно завезти оборудование и развернуть его там. При восстановлении может планироваться закупка «железа», либо его хранение на складе. Нужно учитывать, что большинство систем поставляется под заказ, и быстро найти десятки единиц серверов, СХД, коммутаторов и проч. будет нетривиальной задачей. Как альтернативу складированию оборудования у себя, можно предусмотреть хранение наиболее важного или наиболее редкого оборудования на складе ваших поставщиков. При этом, телекоммуникационные каналы в помещении должны присутствовать, но заключение контракта с провайдером обычно происходит после принятия решения о запуске «холодного» ЦОДа. Восстановление работы в таком ЦОДе при катастрофическом сбое основной площадки вполне может занимать несколько недель. Убедитесь, что ваша компания сможет просуществовать эти несколько недель без ИТ и не лишиться бизнеса (по причине отзыва лицензии, либо невосполнимого кассового разрыва, например) – об этом я писал ранее. Честно говоря, я бы никому не рекомендовал этот вариант резервирования. Возможно, я преувеличиваю роль ИТ в бизнесе некоторых компаний.

Теплый резерв

Это значит, что у нас функционирует альтернативная площадка, в которой есть активные интернет и WAN-каналы, базовая телекоммуникационная и вычислительная инфраструктура. Она всегда «слабее» основной по вычислительным мощностям, некоторое оборудование там может отсутствовать. Самое важное – чтобы на площадке всегда была актуальная резервная копия данных. Действуя «по старинке» можно организовать регулярное перемещение туда резервных копий на лентах. Современный метод – репликация бэкапов по сети из основного ЦОДа. Использование бэкапа с дедупликацией позволит оперативно передавать резервные копии даже по «тонкому» каналу между ЦОДами.

Горячий резерв

Вот он, выбор крутых парней, поддерживающих ИТ-системы, простой которых даже на несколько часов приносит компании огромные убытки. Здесь имеется все необходимое оборудование для полноценной работы ИТ-систем. Обычно фундаментом такой площадки служит система хранения данных, на которую синхронно или асинхронно зеркалируются данные из основного ЦОДа. Для того, чтобы горячий резерв в час Икс смог отработать вложенные в него деньги, должны проводиться регулярные тестовые переводы систем, настройки и версия ОС серверов на основной и резервной площадке должны постоянно синхронизироваться – вручную либо автоматически.

Минус горячего и теплого резерва – дорогостоящее оборудование простаивает в ожидании катастрофы. Выходом из этой ситуации является стратегия распределенного ЦОДа . При таком варианте две (или более) площадки равноправны – большинство приложений могут работать как на одной, так и на другой. Это позволяет задействовать мощности всего оборудования и обеспечить балансировку нагрузки. С другой стороны, серьезно повышаются требования к автоматизации перевода ИТ-сервисов между ЦОДами. Если оба ЦОДа «боевые», бизнес вправе ожидать, что при ожидаемом пике нагрузки на одно из приложений, его можно быстро перевести в более свободный ЦОД. Чаще всего, в подобных ЦОДах присутствует синхронная репликация между СХД, но возможна и небольшая асинхронность (в пределах нескольких минут).

Три волшебных слова

Перед тем, как перейти непосредственно к технологиям катастрофоустойчивости ИТ-сервисов, напомню три «волшебных» слова, которые определяют стоимость любого DR-решения: RTO, RPO, RCO.
  • RTO (Recovery time objective) – время, за которое возможно восстановить ИТ-систему
  • RPO (Recovery point objective) – сколько данных будет потеряно при аварийном восстановлении
  • RCO (Recovery capacity objective) – какую часть нагрузки должна обеспечивать резервная система. Этот показатель может измеряться в процентах, транзакциях ИТ-систем и прочих величинах.

RPO

Первое деление, которое мы можем провести между всем многообразием ИТ-решений для обеспечения катастрофоустойчивости – обеспечивают ли они нулевое RPO или нет. Отсутствие потери данных при сбое обеспечивается синхронной репликацией. Чаще всего, это делается на уровне СХД, но возможно реализовать и на уровне СУБД или сервера (при помощи продвинутого LVM). В первом случае сервер не получает от СХД, с которой он работает, подтверждения об успешности записи, пока СХД не передала эту транзакцию второй системе и не получила от нее подтверждение, что запись прошла успешно.

Синхронную репликацию умеют делать 100% СХД, относящихся к среднему ценовому сегменту и некоторые системы начального уровня от известных вендоров. Стоимость лицензий для синхронной репликации на «простых» СХД начинается от нескольких тысяч долларов. Примерно столько же стоит софт для репликации на уровне серверов на 2-3 сервера. Если у вас нет действующего резервного ЦОДа, не забудьте добавить стоимость закупки резервного оборудования.

RPO в несколько минут может обеспечить асинронная репликация на уровне СХД, ПО управления томами сервера (LVM – Logical volume manager), либо СУБД. До сих пор standby-копия базы данных остается одним из наиболее популярных решений для DR. Чаще всего функционал “log shipping”, как это называется у администраторов СУБД, не лицензируется производителем отдельно. Если у вас пролицензирована БД – реплицируйте на здоровье. Стоимость асинхронной репликации для серверов и СХД не отличается от синхронной, см. предыдущий пункт.

Если мы говорим об RPO в несколько часов, чаще это репликация резервных копий с одной площадки на другую. Большинство дисковых библиотек умеют делать это, часть ПО для резервного копирования – тоже. Как я уже говорил, при таком варианте здорово поможет дедупликация. Вы не только будете меньше загружать канал передачей резервных копий, но и сделаете это намного быстрее - каждый передаваемый бэкап будет занимать в десятки или сотни раз меньше времени, чем в реальности. С другой стороны, надо помнить, что первый бэкап при дедупликации все равно должен передать в систему массу уникальных данных. «Настоящую» дедупликацию вы увидите после недельного цикла резервного копирования. При синхронизации дисковых библиотек - то же самое. Если расчетное время передачи при вашей ширине канала между ЦОД составляет несколько дней и даже недель (что может и стоить немало), есть смысл сначала поставить вторую библиотеку рядом, выполнить синхронизацию и увезти ее в резервный ЦОД.


Синхронизация резервных копий между ЦОД

RTO

Когда стоит задача минимизации времени восстановления (RTO ), процесс должен быть максимально документирован и автоматизирован. Одно из лучших и наиболее универсальных решений – HA-кластеры с территориально разнесенными узлами. Чаще всего, такие решения строятся на базе репликации СХД, но возможны и другие варианты. Лидирующие продукты в этой области, например, Symantec Veritas Cluster, имеют в своем составе модули по работе с СХД, переключающие направление репликации, когда необходимо перезапустить сервис на резервном узле. Для менее продвинутых кластеров (например Microsoft Cluster Services, встроенный в Windows) основные производители СХД (IBM, EMC, HP) предлагают надстройки, делая из обычного HA-кластера катастрофоустойчивый.


Географически распределенный кластер

Редко кто задумывается про интересную особенность подавляющего большинством решений по репликации данных – их «однозарядность». Вы можете получить на резервной площадке только одно состояние данных. Если система с этими данными по какой-то причине не стартовала – переходим к плану «Б». Чаще всего это восстановление из резервной копии с большой потерей данных. Из перечисленных мной технологий исключение составит только репликация тех же бэкапов. Ответом здесь является использование класса решений Continuous Data Protection. Их суть в том, что все записи, приходящие от сервера, помечаются и сохраняются в определенном журнальном томе на резервной площадке. При восстановлении системы можно выбрать любую точку из этого журнала и получить состояние не только на момент аварии, в которой данные были испорчены, но и за несколько секунд. Такие решения защищают от внутренней угрозы – удаления данных пользователями. В случае репликации СХД – ей все равно, что передавать – пустой том или вашу наиболее критичную БД. При использовании CDP можно выбрать момент прямо перед удалением информации и восстановиться на него. Стоимость систем CDP обычно – десятки тысяч долларов. Один из наиболее удачных примеров, на мой взгляд – EMC RecoverPoint.


Схема решения на основе RecoverPoint

В последнее время набирают популярность системы виртуализации СХД . Помимо своей основной функции – объединения массивов разных вендоров в единый пул ресурсов – они могут сильно помочь и в организации распределенного ЦОДа. Суть виртуализации СХД в том, что между серверами и системами хранения появляется промежуточный слой контроллеров, пропускающих сквозь себя весь трафик. Тома с СХД презентуются не напрямую серверам, а этим виртуализаторам. Они, в свою очередь, раздают их хостам. В слое виртуализации можно делать репликацию данных между разными СХД, а зачастую есть и более продвинутые возможности - снэпшоты, многоуровневое хранение и т. д. При этом самая базовая функция виртуализаторов является самой нужной для целей DR. Если у нас есть две СХД в разных ЦОДах, соединенных оптической магистралью, мы берем тома с каждой из них и собираем «зеркало» на уровне виртуализатора. В итоге мы получаем один виртуальный том на два ЦОДа, который и видят серверы. Если эти серверы виртуальные – начинает работать Live Migration виртуальных машин и можете «на ходу» переводить задачи между ЦОДами – пользователи ничего не заметят.

Полная потеря ЦОДа будет отработана обычным HA-кластером в автоматическом режиме за несколько минут. Пожалуй, виртуализация разнесенных СХД позволяет обеспечить минимальное время восстановления для большинства приложений. Для CУБД есть непревзойденный Oracle RAC и его аналоги, но стоимость заставляет задуматься. Виртуализация SAN пока тоже не дешева, для небольших объемов СХД стоимость решения может быть меньше $100К, но в большинстве случаев цена выше. На мой взгляд, наиболее проверенным решением является IBM SAN Volume Controller (SVC), наиболее технически совершенным – EMC VPLEX.

Кстати, если не все ваши приложения еще живут на виртуальной среде, стоит спроектировать резервный ЦОД для них на виртуальных машинах. Во-первых, выйдет намного дешевле, во вторых, сделав это для резерва, недалеко и до миграции основных систем под управление какого-нибудь гипервизора…

Конкуренция на рынке аутсорсинга ЦОД делает более выгодной аренду стойкомест в ЦОДе провайдера, по сравнению со строительством и эксплуатацией своего резервного центра. Если вы размещаете у него виртуальную инфраструктуру, выйдет серьезная экономия на арендных платежах. Но и аутсорсинговые ЦОДы уже не на вершине прогресса. Лучше строить резервную инфраструктуру сразу в «облаке». Синхронизацию данных с основными системами при этом можно обеспечить репликацией на уровне сервера (есть отличное семейство решений DoubleTake от Vision Solutions).

Последний, но очень важный момент, о котором нельзя забывать при проектировании катастрофоустойчивой ИТ-инфраструктуры – рабочие места пользователей. То, что поднялась база данных, не означает возобновления бизнес-процесса. Пользователь должен иметь возможность выполнять свою работу. Даже полноценный резервный офис, в котором стоят выключенные компьютеры для ключевых сотрудников – не идеальное решение. У человека на утраченном рабочем месте могут быть справочные материалы, макросы, и проч., полноценная работа без которых невозможна. Для наиболее важных для компании пользователей разумным выглядит переход на виртуальные рабочие места (VDI). Тогда на рабочем месте (будь то обычный ПК или модный «тонкий» клиент) не хранятся никакие данные, он используется только как терминал, чтобы достучаться до Windows XP или Windows 7, работающей на виртуальной машине в ЦОДе. Доступ к такому рабочему месту легко организовать из дома или из любого компьютера в филиальной сети. Например, если у вас несколько зданий и одно из них недоступно, ключевые пользователи могут приехать в соседний офис и сесть на рабочие места «менее ключевых». Затем они спокойно логинятся в систему, попадают в свою виртуальную машину и фирма оживает!

В завершение, вот основные вопросы, которые стоит задать при оценке DR-решения:

  • От каких сбоев защищает?
  • Какие RPO/RTO/RCO обеспечивает?
  • Сколько стоит?
  • Насколько сложна эксплуатация?
Катастрофоустойчивых решений бесчисленное множество – как коробочных, так и тех, которые можно сделать практически своими руками. Пожалуйста, поделитесь в комментариях что есть у вас и историями, как эти решения вас выручали. Если у вас работает что-то из описанных выше систем или их аналоги – оставляйте отзывы, насколько спокойно вы спите, когда ИТ-системы под их защитой.

Волоконная оптика и оптоэлектроника находят
широкое применение при построении всех уровней
сетей
электросвязи:
магистральных
линий
междугородной и городской связи, сетей доступа и
структурированных кабельных систем.
Ввиду важности задач, решаемых с их помощью, к
надежности предъявляются очень высокие требования.
При этом под надежностью понимается
способность поддерживать передачу информации с
заданной скоростью и с заданной достоверностью в
течение требуемого промежутка времени.

Высокий уровень надежности современных
сетей оптической связи обеспечивается реализацией
комплекса различных мер, среди них одной из
ключевых являются средства полного или хотя бы
частичного восстановления связи в аварийных
ситуациях.
Традиционно
для
этого
применялось
резервирование - целенаправленное введение в
систему определенной избыточности с целью
обеспечения
нормального
функционирования
объекта после возникновения отказа в его элементах.

Волоконно-оптические линии связи нуждаются в
надежном резервировании. Так как они подвержены
авариям природного характера, которые происходят в
основном в зимнее время и связаны с промерзанием
оборудования или грунта, что влечет за собой
внутренние повреждения волокон или выход из строя
линейной аппаратуры ВОЛС.

Варианты повышения надежности сети с привлечением резервирования:

Варианты повышения надежности сети с
привлечением резервирования:
ЛИНЕЙНОЕ РЕЗЕРВИРОВАНИЕ
СИСТЕМНОЕ РЕЗЕРВИРОВАНИЕ
РЕЗЕРВИРОВАНИЕ НА ОСНОВЕ WDM

ЛИНЕЙНОЕ РЕЗЕРВИРОВАНИЕ:

Аварийные ситуации в линейной части сети в
большинстве случаев возникают из-за механических
повреждений (обрывов) оптического волокна, поэтому
очевидным решением этой проблемы является
увеличение
количества
доступных
физических
трактов передачи, на которые будет осуществляться
переключение при возникновении неисправности.

КОЛЬЦЕВЫЕ СТРУКТУРЫ
При построении волоконно-оптических сетей связи часто используется
кольцевая топология, для которой самовосстановление является естественным
свойством. В большинстве случаев линейная часть кольцевой структуры в сетях
связи общего пользования строится на основе пары волокон (так называемое
сдвоенное кольцо). В результате у передающего узла имеется два варианта
доступа к приемному: по часовой стрелке и в обратном направлении. Один из
маршрутов выполняет функции основного и используется для передачи трафика,
другой рассматривается как резервный.
Схема работы участка сети с линейным резервированием
а) нормальный режим; б) режим использования резерва.

СИСТЕМНОЕ РЕЗЕРВИРОВАНИЕ:

Организация
системного
резервирования
в
оптической сети предполагает одновременное введение
дополнительных волокон в линейную часть и блоков в
активное приемопередающее оборудование на узлах
сети. Если на основном направлении передачи
повреждаются световоды или происходит отказ узловой
сетевой аппаратуры, то выполняется переключение на
резервное направление.
Схема участка сети с системным резервированием.

РЕЗЕРВИРОВАНИЕ НА ОСНОВЕ WDM

В системах со спектральным уплотнением, помимо
описанных
выше
способов,
можно
осуществлять
резервирование на оптическом уровне. Для этого
выделяются дополнительные (резервные) длины волн, на
которые происходит переключение в случае отказа основной
оптической несущей.
Схема резервирования сети CWDM с кольцевой физической
топологией.

10. В зависимости от режима работы резервных элементов до отказа основного элемента различают следующие виды резерва:

«горячий» (нагруженный) резерв;
«тёплый» (облегчённый) резерв;
«холодный» (ненагруженный) резерв;

11. 1

*

12.

Для замены отказавшего элемента достаточно
иметь резервный (запасной) элемент на складе. Однако
продолжительность ручной замены составляет единицы
часов,
что
для
многих
систем
автоматизации
недопустимо долго. Сократить время вынужденного
простоя позволяет применение контроллеров и модулей
ввода-вывода с разъёмными клеммными соединителями
и с возможностью «горячей» замены.

13. «горячий» резерв

При горячем резервировании резервный
блок находится под напряжением и в любой
момент готов принять на себя выполнение
рабочих функций при включении его входа и
выхода в канал прохождения сигнала. В этом
режиме ресурс резервного блока расходуется
так же, как и у основного. Горячим резервом
называется аппаратура, обладающая такими же
характеристиками,
что
и
основная,
подключаемая параллельно и работающая
одновременно с нею.

14.

Для обеспечения «горячей»
предусмотреть следующее:
замены
необходимо
● защиту от статического электричества, которое может
возникать на теле оператора, выполняющего замену
устройства;
● необходимую последовательность подачи напряжений
питания и внешних сигналов (для этого используют, напри
мер, разъёмы с контактами разной длины и секвенсоры
внутри устройства);
● защиту системы от броска тока, вызванного зарядом
ёмкостей подключаемого устройства, например с помощью
токоограничительных резисторов или отдельного источника
питания;
● защиту устройства от перенапряжения, короткого
замыкания,
переполюсовки,
превышения
напряжения
питания, очного подключения

15. «холодный» резерв

Холодным
резервом
называется
аппаратура,
обладающая
теми
же
характеристиками, что и основная, исправная и
готовая к включению в любой момент времени, но
не работающая одновременно с основной. При
холодном
резервировании
резервный
блок
полностью отключен от источников питания.
Ресурс резервного блока при этом не расходуется
до тех пор, пока блок не будет включен.

16.

Основное
отличие
между
«горячим»,
«холодным» и «тёплым» резервом состоит в
длительности периода переключения на резерв.
При «горячем» резервировании контроллеров
время переключения составляет от единиц
миллисекунд до долей секунды, при «тёплом» -
секунды, при «холодном» - минуты.

17.

Основной характеристикой структурного
резервирования является его кратность –
отношение числа резервирующих элементов к
числу резервируемых элементов (основных),
выраженное несокращенной дробью: Hot Spare ), иногда жаргонно хотспара - технология резервирования электронного оборудования, в которой резерв подключен к системе и подменяет вышедшую из строя компоненту в автоматическом режиме, или, хотя бы, без прерывания работы системы. Чаще всего применяется для жёстких дисков, оперативной памяти компьютеров. В контексте некоторых систем может называться просто "spare" (подразумевая, что устройства с холодной заменой просто в системе не видны и особого термина не требуют).

Горячий резерв для систем хранения данных

Чаще всего диски горячей замены используются в сочетании с RAID -массивами. В этом случае выделяют несколько видов hotspare дисков:

  • локальные (англ. local , англ. array-owned ) - диск принадлежит к конкретному массиву и используется для подмены вышедшего из строя диска только в заданном массиве, если в системе несколько массивов и диск выходит из строя в соседнем массиве, то локальный для другого массива диск не используется для подмены.
  • глобальные, общие (англ. global , англ. shared ) - диск не принадлежит к ни к одному массиву и может быть использован для подмены вышедшего из строя диска в любом из массивов. В сочетании глобальных и локальных хотспар бывает два алгоритма использования: либо сначала локальные, а потом глобальные, либо сначала глобальные, а потом локальные. Второй вариант позволяет формировать массивы с чуть большей надёжностью у выбранных массивов, первый - у всех.
  • групповые (англ. group ) - в этом случае некоторые массивы объединяются в группу, в пределах которой может использоваться резервный диск. Массивы не в группе этот диск не получают (такой вариант, например, использует linux-raid).

Индикация

Некоторые системы и raid-контроллеры могут использовать специфическое обозначение светодиодом (либо особым видом мигания светодиода) для указания на хотспару.

Контроль состояния горячего резерва

Многие системы осуществляют периодическую проверку состояния hostspare-дисков (с помощью чтения или записи) - это позволяет убедиться, что диск для подмены находится в нормальном состоянии и защитить от ситуации, когда диск, добавляемый в массив вместо вышедшего из строя, сам оказывается сбойным.

Аварийное перестроение массива

Часто жёсткие диски выходят из строя не полностью, а частично (в пределах нескольких секторов). Некоторые системы способны выполнять предварительное копирование данных с частично пострадавшего массива на резервный диск до того момента, когда извлекается пострадавший диск. Сбойные места перестраиваются согласно алгоритмам RAID, нормальные просто копируются с полусбойного диска. Это минимизирует время, когда массив находится в degradated состоянии и снижает нагрузку (т.к. не нужно пересчитывать контрольные суммы для всего массива).

Альтернативы

Холодный резерв (устройство требует ручного подключения), чаще всего так называют находящиеся на складе вблизи оборудования запасные компоненты. Иногда выделяют тёплый резерв , то есть компоненты, которые требуют ручной замены, но не требуют остановки системы (см. горячая замена).

См. также


Wikimedia Foundation . 2010 .

Смотреть что такое "Горячий резерв" в других словарях:

    См. Вспомогательный пробег паровоза. Технический железнодорожный словарь. М.: Государственное транспортное железнодорожное издательство. Н. Н. Васильев, О. Н. Исаакян, Н. О. Рогинский, Я. Б. Смолянский, В. А. Сокович, Т. С. Хачатуров. 1941 … Технический железнодорожный словарь

    горячий резерв - — Тематики электросвязь, основные понятия EN hot stand byhot standby …

    горячий резерв - aktyvusis rezervas statusas T sritis Standartizacija ir metrologija apibrėžtis Rezervas, apibūdinamas tuo, kad atsarginiai įtaisai veikia ta pačia veika, kaip ir pagrindiniai įtaisai. atitikmenys: angl. active reserve; loaded reserve vok.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas Справочник технического переводчика

    включенный резерв мощности судовой электроэнергетической системы - Ндп. вращающийся резерв горячий резерв Разность между значениями включенной мощности и нагрузкой судовой электроэнергетической системы в рассматриваемом режиме работы. [ГОСТ 22652 77] Недопустимые, нерекомендуемые вращающийся резервгорячий резерв … Справочник технического переводчика

    Включенный резерв мощности судовой электроэнергетической системы - 27. Включенный резерв мощности судовой электроэнергетической системы Ндп. Вращающийся резерв Горячий резерв Разность между значениями включенной мощности и нагрузкой судовой электроэнергетической системы в рассматриваемом режиме работы

На стадии проектирования СЭС для обеспечения требуемой надежности приходится во многих случаях как минимум дублировать отдельные элементы и даже отдельные системы, т.е. использовать резервирование.

Резервирование характерно тем, что оно позволяет повысить надежность системы по сравнению с надежностью составляющих ее элементов. Повышение надежности отдельно взятых элементов требует больших материальных затрат. В этих условиях резервирование, например, за счет введения дополнительных элементов является эффективным средством обеспечения требуемой надежности систем.

Если при последовательном соединении элементов общая надежность системы (т.е. вероятность безотказной работы) ниже надежности самого ненадежного элемента, то при резервировании общая надежность системы может быть выше надежности самого надежного элемента.

Резервирование осуществляется путем введения избыточности. В зависимости от природы последней резервирование бывает:

Структурное (аппаратное);

Информационное;

Временное.

Структурное резервирование заключается в том, что в минимально необходимый вариант системы, состоящей из основных элементов, вводятся дополнительные элементы, устройства или даже вместо одной системы предусматривается использование нескольких одинаковых систем.

Информационное резервирование предусматривает использование избыточной информации. Его простейшим примером является многократная передача одного и того же сообщения по каналу связи. Другим примером являются коды, применяемые в управляющих ЭВМ для обнаружения и исправления ошибок, возникающих в результате сбоев и отказов аппаратуры.

Временное резервирование предусматривает использование избыточного времени. Возобновление прерванного в результате отказа функционирования системы происходит путем ее восстановления, если имеется определенный запас времени.

Существует два метода повышения надежности систем путем структурного резервирования:

1) общее резервирование, при котором резервируется система в целом;

2) раздельное (поэлементное) резервирование, при котором резервируются отдельные части (элементы) системы.

Схемы общего и раздельного структурного резервирования представлены соответственно на рис. 5.3 и 5.4, где n число последовательных элементов в цепи, m – число резервных цепей (при общем резервировании) или резервных элементов для каждого основного (при раздельном резервировании)

При m=1 имеет место дублирование, а при m=2 – троирование. Обычно стремятся по возможности применять раздельное резервирование, т к при этом выигрыш в надежности часто достигается значительно меньшими затратами, чем при общем резервировании.

В зависимости от способа включения резервных элементов различают постоянное резервирование, резервирование замещением и скользящее резервирование.

Постоянное резервирование – это такое резервирование, при котором резервные элементы участвуют в работе объекта наравне с основными. В случае отказа основного элемента не требуется специальных устройств, вводящих в действие резервный элемент, поскольку он включается в работу одновременно с основным.

Резервирование замещением – это такое резервирование, при котором функции основного элемента передаются резервному только после отказа основного. При резервировании замещением необходимы контролирующие и переключающие устройства для обнаружения факта отказа основного элемента и переключения с основного на резервный.

Скользящее резервирование – представляет собой разновидность резервирования замещением, при котором основные элементы объекта резервируются элементами, каждый из которых может заменить любой отказавший элемент.

Оба вида резервирования (постоянное и замещением) имеют свои преимущества и недостатки.

Достоинством постоянного резервирования является простота, т.к. в этом случае не требуются контролирующие и переключающие устройства, понижающие надежность системы в целом, и, самое главное, отсутствует перерыв в работе. Недостатком постоянного резервирования является нарушение режима работы резервных элементов при отказе основных.

Включение резерва замещением обладает следующим преимуществом: не нарушает режима работы резервных элементов, сохраняет в большей степени надежность резервных элементов, позволяет использовать один резервный элемент на несколько рабочих (при скользящем резервировании).

В зависимости от режима работы резервных элементов различают нагруженный (горячий) и ненагруженный (холодный) резерв.

Нагруженный (горячий) резерв в энергетике называют также вращающимся или включенным. В данном режиме резервный элемент находится в том же режиме, что и основной. Ресурс резервных элементов начинает расходоваться с момента включения в работу всей системы, и вероятность безотказной работы резервных элементов в этом случае не зависит от того, в какой момент времени они включаются в работу.

Облегченный (теплый) резерв характеризуется тем, что резервный элемент находится в менее нагруженном режиме, чем основной. Поэтому, хотя ресурс резервных элементов также начинает расходоваться с момента включения всей системы в целом, интенсивность расхода ресурса резервных элементов до момента их включения вместо отказавших значительно ниже, чем в рабочих условиях. Этот вид резерва обычно размещается на агрегатах, работающих на холостом ходу, и, следовательно, в данном случае ресурс резервных элементов срабатывается меньше по сравнению с рабочими условиями когда агрегаты несут нагрузку Вероятность безотказной работы резервных элементов в случае этого вида резерва будет зависеть как от момента их включения в работу, так и от того, насколько отличаются законы распределения вероятности безотказной работы их в рабочем и резервном условиях.

В случае ненагруженного (холодного) резерва резервные элементы начинают расходовать свой ресурс с момента их включения в работу вместо основных. В энергетике этим видом резерва служат обычно отключенные агрегаты.

Расчеты надежности систем с параллельно включенными элементами зависят от способа резервирования.

НАДЕЖНОСТЬ СИСТЕМ ПРИ ПОСТОЯННОМ ОБЩЕМ РЕЗЕРВИРОВАНИИ

Будем считать, что резервируемые и резервные элементы равнонадежны, т.е.
и
. Для удобства вероятности безотказной работы и появления отказов отдельных элементов обозначаем в этом и последующем разделах прописными буквами.

С учетом схемы замещения (рис 5.5) и формулы (5.18) вероятность отказа системы с m резервными цепями можно рассчитать следующим образом:

, (5.22)

где (t) – вероятность отказа основной цепи,
– вероятность отказаi-й резервной цепи.

Соответственно вероятность безотказной работы системы

(5.23)

В соответствии с формулой (5 8) имеем

(5.24)

При одинаковых вероятностях отказов основной и резервной цепей
формулы (5 22) и (5 23) принимают вид:

, (5.25)

(5.26)

Среднее время безотказной работы системы при общем резервировании

(5.27)

где – интенсивность отказов системы,
, – интенсивность отказов любой из (m+1) цепей, – интенсивность отказовi-го элемента

Для системы из двух параллельных цепей (m=1) формула (5.27) принимает вид:

(5.28)

Среднее время восстановления системы в общем случае определяется по формуле

(5.29)

где – среднее время восстановленияi-ой цепи.

Для частного случая m=1 формула (5.29) принимает вид:

Пример 5.2.

Рассчитать вероятность безотказной работы в течение 3 месяцев, интенсивность отказов, среднюю наработку на отказ одноцепной ВЛ длиной l=35км вместе с понижающим трансформатором 110/10кВ и коммутационной аппаратурой (рис 5.6).

Схема замещения по надежности рассматриваемой СЭС представляет собой последовательную структуру (рис 5.7)

Интенсивности отказов элементов взяты из табл 3.2:

;

;




Согласно формуле (5.7) определяем интенсивность отказов схемы питания

Этот расчет показывает, что доминирующее влияние на выход схемы из строя оказывает повреждаемость воздушной линии. Средняя наработка на отказ схемы питания

Вероятность безотказной работы схемы в течение t=0,25года

Пример 5.3.

Определить, насколько выше показатели надежности понизительной трансформаторной подстанции 110/10кВ при постоянной совместной работе обоих трансформаторов в течение 6 месяцев по сравнению с однотрансформаторной подстанцией. Отказами коммутационных аппаратов и преднамеренными отключениями пренебрегаем.

Исходные данные, взятые из табл. 3.2, следующие:


;

Вероятность безотказной работы в течение 6 месяцев одного трансформатора

Средняя наработка на отказ одного трансформатора

Вероятность безотказной работы двухтрансформаторной подстанции, рассчитанная по формуле (5.20):

Средняя наработка на отказ двухтрансформаторной подстанции, рассчитанная по формуле (5.28):

лет

Интенсивность отказов двухтрансформаторной подстанции

Среднее время восстановления двухтрансформаторной подстанции (см. формулу (5.30))

Анализ результатов показывает, что надежность двухтрансформаторной подстанции намного превышает надежность однотрансформаторной подстанции.

Пример 5.4.

Рассмотрим секцию РУ 6кВ, от которой питаются 18 отходящих линий (рис. 5.8) Интенсивность отказов выключателей, сопровождающихся короткими замыканиями, оценивается величиной = 0,003
, интенсивность отказов с

короткими замыканиями для сборных шин на одно присоединение
(см. табл. 3 2). Определить интенсивность кратковременных погашений секции РУ, предполагая абсолютную надежность автоматического ввода резерва (АВР) и выключателяQ2, резервирующего питание секции.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: