Промышленное производство
Промышленный Интернет вещей | Промышленные материалы | Техническое обслуживание и ремонт оборудования | Промышленное программирование |
home  MfgRobots >> Промышленное производство >  >> Manufacturing Technology >> Промышленные технологии

Единая точка отказа | Простой обзор

В области информационных технологий проектирование систем включает в себя процесс определения архитектуры, интерфейсов, модулей и данных для системы, которая должна удовлетворять определенным требованиям. Это критически важный процесс для повышения эффективности разработки продуктов / услуг и обеспечения удобного взаимодействия с пользователем.

Допустим, у вас есть приложение, которое ежедневно обслуживает миллионы пользователей. На стороне сервера вам нужны отличные инженеры, чтобы обрабатывать такой большой объем запросов. Запросы к серверу никогда не должны завершаться ошибкой, даже если есть проблема с базой данных или аппаратный сбой.

Однако, если бэкэнд или интерфейс не спроектирован правильно, простая ошибка может привести к завершению работы всего приложения - всего, от сервера до компьютерной сети. Одним из основных источников таких ошибок является Single Point Of Failure (SPOF).

В этой обзорной статье мы объяснили, почему SPOF - самая серьезная проблема для ИТ-специалистов, его общий источник и способы устранения таких сбоев. Начнем с основного вопроса.

Что такое единственная точка отказа?

Определение: Единственная точка отказа - это любая часть системы, которая приводит к прекращению работы всей системы в случае отказа. Проще говоря, если что-то сломается, все выйдет из строя.

SPOF возникают из-за ошибочного дизайна и плохих методов реализации. Они нежелательны в любой системе, будь то программное приложение, аппаратный модуль, производственная система или бизнес-практика.

Например, если вы запускаете веб-сайт, который размещен только на одном сервере в определенном месте, то этот сервер будет единственной точкой отказа. В случае сбоя сервера посетители не смогут получить доступ к веб-сайту. Эта единая точка может остановить все действия, связанные с вашим сайтом. Если такой риск существует в вашем бизнесе, вам необходимо принять меры для его снижения.

Какое решение?

Самый эффективный способ снизить потенциальный риск SPOF - это добавить избыточность. Это включает в себя установку избыточных аппаратных компонентов и программных приложений.

Например, можно использовать избыточные массивы независимых дисков (RAID) для хранения баз данных сервера каталогов или развернуть несколько дублирующих экземпляров серверов каталогов на разных хостах.

Избыточность можно добавить на разных уровнях. Возьмем, к примеру, независимого таксиста. На низком уровне у него могут быть инструменты и запчасти для ремонта автомобиля в случае его поломки. На среднем уровне он может одолжить такси своего друга, чтобы выполнить эту работу. На высшем уровне у него может быть другая машина и достаточно компонентов, чтобы полностью заменить неисправные детали в случае множественных поломок.

Теперь давайте посмотрим на простой пример избыточности вычислений.

1.) В простой настройке может быть несколько возможных единственных точек отказа.

Рисунок 1

2.) Некоторые единичные точки отказа можно избежать, добавив дублирующиеся компоненты оборудования.

Рисунок 2

3). Нулевой SPOF может быть достигнут путем создания полностью резервированной системы, хотя такая установка намного дороже, чем простая установка, показанная на рисунке 1.

Рисунок 3 | Нулевой SPOF

На системном уровне можно развернуть подсистему балансировки нагрузки, чтобы обеспечить высокую доступность кластера серверов. В этом случае на каждом сервере может быть несколько жестких дисков, блоков питания и других модулей. Более высокий уровень избыточности может быть достигнут путем добавления дополнительных серверов, которые могут взять на себя нагрузку активных серверов в случае их выхода из строя.

Сам центр обработки данных поддерживает множество операций, например бизнес-логику. Следовательно, он сам по себе является потенциальным SPOF для бизнеса, если его функции не могут быть воспроизведены где-либо еще.

На уровне сайта (наивысшем) весь центр обработки данных может быть реплицирован с различными настройками и доступен, когда основной сервер перестает отвечать. Этот тип резервирования обычно находится в центре внимания программы обеспечения отказоустойчивости или восстановления ИТ-инфраструктуры.

Чтобы не было SPOF, большие сети, включая Интернет и ARPANET, используют коммутацию пакетов, метод маршрутизации и передачи данных по цифровой сети в пакеты. Он использует несколько путей между двумя хостами в сети и оптимально использует пропускную способность канала.

Прочтите:10 организаций, контролирующих Интернет

Когда возникает ошибка в любом узле между двумя хостами, данные передаются через альтернативный узел. Коммутация пакетов также минимизирует задержку передачи и повышает надежность связи.

Для предотвращения единой точки отказа широко используются три сетевых протокола:

  1. От промежуточной системы к промежуточной системе эффективно перемещает информацию в компьютерной сети, определяя лучший маршрут для данных.
  2. Сначала открывайте кратчайший путь распределяет информацию о маршрутизации между маршрутизаторами, принадлежащими одной автономной системе. Для передачи данных в нем используется алгоритм кратчайшего пути (алгоритм Дейкстры).
  3. Преодоление кратчайшего пути упрощает разработку и настройку сети, обеспечивая многопутевую маршрутизацию.

Оценка SPOF

Три основных места, где обычно появляется SPOF, - это оборудование, программное обеспечение и сторонние сервисы / поставщики. Люди также являются единственной точкой отказа в большинстве организаций, но на них часто не обращают внимания. Люди в бизнесе могут быть SPOF по нескольким причинам, таким как ошибки, мошенничество, нечестность, недостаток знаний и ограниченный опыт.

Следующим шагом после обнаружения SPOF является его классификация с точки зрения сложности его исправления. Всего может быть три категории:

В дополнение к этому, SPOF можно классифицировать с точки зрения вероятности возникновения (низкий, средний и высокий риск) и их воздействия на бизнес (низкий, средний и высокий уровень воздействия).

Предотвращение единой точки отказа

Поскольку очень многие критически важные процессы зависят от сетевого подключения, просто недопустимо просто терпеть перебои в работе центра обработки данных. Тем не менее, более 30% всех центров обработки данных ежегодно выходят из строя. Около 34% предприятий говорят, что один час простоя стоит более 1 миллиона долларов.

Независимо от потерь, которые произошли из-за простоя центра обработки данных, в действительности 80% простоев можно предотвратить. Хотя любой инструмент в сети может представлять опасность для SPOF, большинство отключений вызвано вредоносным ПО и другими киберугрозами.

Прочтите:13 различных типов компьютерных вирусов

Современные инструменты защиты от угроз, включая балансировщики нагрузки, системы предотвращения вторжений, брандмауэры веб-приложений и решения Advanced Threat Protection, всегда подвергаются риску во время сбоев питания, сбоя контроллера сетевого интерфейса или при фильтрации интернет-трафика.

Эти инструменты уязвимы как для обычных угроз, таких как атаки методом перебора, так и для сложных угроз, таких как внедрение внешних объектов XML или подделка межсайтовых запросов. Поскольку они не могут постоянно защищать сеть, необходимо принимать избыточные меры безопасности.

Существует несколько методов реализации архитектуры брандмауэра веб-приложений, которые сводят к минимуму эффективность и частоту широкого спектра атак. Например, многоуровневые брандмауэры веб-приложений разделяют разные модули приложений на несколько уровней в зависимости от их операций.

Поскольку каждый уровень работает в отдельной системе, SPOF отсутствует. Точно так же правильная реализация нескольких балансировщиков нагрузки может уменьшить количество единой точки отказа в сети.

Не кладите все яйца в одну корзину

Хотя многие компании предоставляют свои собственные версии облачных резервных копий, не рекомендуется полагаться только на одну резервную копию для защиты данных вашего бизнеса. Даже облачные сервисы от технологических гигантов, таких как Amazon, Microsoft и Google, терпят неудачу несколько раз в год.

Прочтите:25 крупнейших изобретений в области компьютерных наук

Если вы управляете компанией, вам необходимо принять во внимание все возможные сценарии при создании избыточности. Не думайте, что кто-то может обеспечить 100% бесперебойную работу и всегда будьте готовы с Планом Б, если что-то пойдет не так.

Углубленные исследования

SPOF в рамках систем-систем

Исследователи из Ливерпульского университета Джона Мура, Великобритания, выделяют основные проблемы, с которыми сталкиваются при интеграции отдельных систем в большие сложные гетерогенные системы-системы.

Многие современные подходы имеют тенденцию концентрироваться на одной небольшой конкретной уязвимой области. Некоторые из них являются теоретическими или не масштабируемыми из-за большого количества взаимодействующих компонентов. В исследовании описывается, как единая точка отказа может серьезно повлиять на сотрудничающие системы и привести к значительным финансовым потерям для бизнеса.

Устранение SPOF при программном резервировании

Программная избыточность обычно считается эффективным и недорогим способом повышения надежности. Избыточное исполнение с точки зрения тройного модульного резервирования (TMR) довольно популярно, но оно оставляет незащищенные SPOF.

В этом исследовании представлен целостный подход, названный «Комбинированное резервирование», который защищает критически важные для безопасности компоненты системы от мягких усилий, устраняя при этом уязвимости, вызванные SPOF. Он использует избыточное выполнение вместе с закодированной обработкой и может быть легко интегрирован в существующие проекты.

Прочтите:9 различных типов тестирования на проникновение

Минимизация SPOF в древовидной маршрутизации

Древовидная маршрутизация (TR) использует ссылки «родитель-потомок» для передачи пакетов. Эти ссылки требуют большего количества переходов, когда исходный и целевой узлы принадлежат разным ветвям дерева. Узлы, расположенные ближе к координатору, могут передавать больше пакетов, что приводит к более высокому потреблению энергии и большей перегрузке. Это могло создать проблему с SPOF.

Группа исследователей из Национального университета прикладных наук Гаосюн, Тайвань, разработала алгоритм маршрутизации дерева освобождающего SPOF, позволяющий передавать пакеты по кратчайшему пути и избегать перегрузок. Алгоритм уменьшает среднее количество переходов, минимизирует сквозную задержку, увеличивает пропускную способность и продлевает срок службы узлов дерева.


Промышленные технологии

  1. Резонанс простой серии
  2. Простота обслуживания:используйте чувства и чувствительность
  3. Что такое квантовая финансовая система? [Простой обзор]
  4. NEMS - наноэлектромеханические системы | Простой обзор
  5. Новая система может обнаруживать отказы в электромеханическом оборудовании до того, как они возникнут
  6. Простое подключение и работа с системой управления SYNTEC
  7. Простые решения для старых систем автоматизации
  8. Наиболее распространенные причины отказа гидравлической системы
  9. Эти пять простых шагов оптимизируют вашу программу обслуживания
  10. Одноточечный поток