Инженерия хаоса интегрирована в цепочку инструментов DevOps, но как насчет ИТ-операций
Хаос-инжиниринг - это последняя разработка в мире информационных технологий, и, как следует из названия, такая интерпретация технологии регулируется таким образом, чтобы обеспечивать результаты в экстремальных условиях для специальной технологической единицы. Chaos Engineering продвигается вперед с помощью очень простого подхода, заключающегося в проверке целостности или интеллектуальной способности системы противостоять бурному потоку событий. Такие как серверные или связанные сетевые системы будут подвергаться бомбардировке сценариями увеличенного / пикового трафика, чтобы проверить их способность противостоять этим изменениям и обеспечить оптимизированную и ориентированную на качество производительность.
Стресс-тестирование - это еще одна дисциплина в мире вычислений, которая учитывает тестирование ИТ-систем в стрессовых условиях и проверку их различных слабых мест, а также то, как наилучшим образом бороться с этими уязвимостями. Инжиниринг CE или иначе хаос - подходящая тенденция, которая впервые возникла с системами DevOps для тестирования производительности систем облачных вычислений. Самым первым намерением использования системы было проверить производительность выделенной части ИТ-технологии в различных условиях. Были представлены пиковые, а также световые / нормальные условия, и значения производительности были одинаково собраны для перекрестного соответствия после завершения тестирования.
Выяснилось, что тысячи узлов на ИТ-серверах, использующие беспорядочную инженерию для тестирования технологии DevOps, бездействуют, вообще ничего не делают, но обходятся организации в серьезную сумму денег. Наряду с этими контрольными показателями было обнаружено несколько других нарушений, которые позже были устранены и приняты меры по исправлению положения. Короче говоря, с помощью Chaos Engineering можно тестировать и запускать различные дисциплины ИТ и технологических аспектов в соответствии с оптимизированными значениями, с которыми они могут работать.
Применение Chaos Engineering в ИТ
Инженерия Хаоса находит свое применение во множестве ИТ-систем, таких как Netflix. Инженерия Хаоса позволила им перейти на виртуальные серверы из физической инфраструктуры и, таким образом, начали их партнерство с AWS (веб-сервисы Amazon). Но в целом Хаос-инжиниринг не так хорошо используется с ИТ-операциями из-за смещения ИТОМ или управления ИТ-операциями от разделов разработки информационных технологий. Это положило конец хаосу инженерии, но все же его услуги в открытом динамическом мире ценятся, такие как интеграция с DevOps и связанными системами.
Кроме того, контейнеризация в облачных приложениях сегодня значительно превысила нормальный предел, и поэтому они больше похожи на масштабируемые инфраструктуры, а не на многоуровневые архитектуры. Разработка и развертывание ИТ-систем находится всего в нескольких щелчках мыши, и именно этим занимается вся ИТ-отрасль, используя разработку Chaos для проверки возможных пределов своих технологий. Многочисленные преимущества технологии хаоса включают в себя тестирование систем до их абсолютных пределов, пока они не откажутся и не смогут выдержать возросшее вычислительное давление. Это поможет инженерам приблизиться к фактической работоспособности или пределу допуска систем, и именно поэтому инженеры могут спасти эти системы от обезглавливания в результате публичного сбоя.
После этого вы узнали о принципах работы и преимуществах Chaos Engineering в мире ИТ, как бы вы посоветовали использовать услуги, предлагаемые этим динамическим элементом на базе ИТ? Что ж, вам нужно будет выполнить следующие 5 пунктов;
- Определение устойчивых состояний
Первый и самый важный шаг, который вы должны выполнить, - это определить текущие устойчивые ограничения для ваших ИТ-систем. Можно отслеживать использование ЦП, ОЗУ и сети, а также можно сделать краткий анализ, чтобы узнать о текущих рабочих пределах вашей технологии. Тем не менее, вы должны быть последовательны с анализом и найти текущую рабочую среду, которая является выполнимой и не будет оказывать никакого давления на работу этих систем, например, создавать узкие места.
- Определите оптимальные условия
Как только вы найдете базовые условия работы, вам нужно будет найти оптимальные условия для этих систем, немного повысив их. Например, узнать о текущем использовании ЦП в настройках, где трафик выше, и в то же время узнать о задержке сети. Составьте специальный список, включающий оптимально определенные условия вашей технологической системы.
- Разработайте гипотезу
Следующее, что вам нужно сделать, это разработать гипотезу, например, где произойдет сбой системы из-за добавленного трафика в системы. Сделайте логическое предположение, приведет ли увеличение трафика через серверные системы к сумасшедшему ЦП или это повлияет на задержку сетевых систем? Составьте здесь список возможных предположений / гипотез, чтобы вы могли проверить их при подаче импульсов в систему с помощью инженерии Хаоса.
- Проверьте свои системы
Разработайте определенный сценарий, при котором либо начинается атака, например, происходит нарушение системы, либо трафик по сети был увеличен до очевидного предела, но, конечно, условия должны регулироваться и контролироваться. Существует практически несколько способов проверки целостности и отказоустойчивости сетевых систем, таких как снятие брандмауэров, увеличение загрузки ЦП или увеличение пропускной способности сети. Как видите, возможности проверить свою гипотезу безграничны.
- Проверка гипотезы
После того, как вы завершили анализ, например настройку системных настроек, сначала уменьшите настройки до оптимального предела, и пусть все работает стабильно. После этого сравните новые и старые результаты тестов и отправьте свои выводы. Вы должны четко сформулировать свою гипотезу, например, добавление большего напряжения к системе привело к ее коллапсу или наоборот.
Если вы хотите профессионально заниматься хаос-инжинирингом и серверными системами, рекомендуется получить сертификацию инженера по Azure DevOps, так как это упростит задачу.
Облачные вычисления
- Что входит в SLA облачных сервисов?
- Что такое повторная платформа в облаке?
- Как развернуть DevOps в облаке
- Будущее технического обслуживания:что цифры говорят о тенденциях технического обслуживания
- Смерть отдела обслуживания и что мы можем с этим сделать
- Что малому и среднему бизнесу нужно знать об USMCA в июле
- Шоу должно продолжаться! Что делать с поврежденными блоками питания
- Что нужно знать о процессе многослойного формования
- Какие специальные промышленные тормозные системы используются в горнодобывающей промышленности?
- Каковы основы гидравлических систем?