Что такое репатриация данных?
Высокая стоимость хранения и использования данных в общедоступном облаке все чаще становится препятствием для компаний. Организации ищут более экономичные альтернативы, поэтому мы наблюдаем все больше и больше случаев репатриации данных (действия извлечения данных, которые в настоящее время находятся в общедоступном облаке, и их повторного размещения на месте или на «голом железе»).
Эта статья представляет собой введение в репатриацию данных. и последствия (как положительные, так и отрицательные) отказа от общедоступного облака в пользу локального хранилища на «голом железе». Читайте дальше, чтобы узнать об основных движущих силах, стоящих за репатриацией данных, и узнайте, будет ли отказ от облачных данных разумным шагом для вашей прибыли.
Что такое репатриация данных?
Репатриация данных — это процесс перемещения данных из общедоступного облака в самоуправляемое хранилище (например, на выделенный сервер или частное облако). В зависимости от того, сколько данных компания решит повторно разместить, репатриация может быть:
- Всего (когда организация извлекает все данные и разрывает связи с общедоступным облаком).
- Частично (когда компания решает извлечь некоторые, но не все данные из облака, что обычно происходит, когда команда пытается повысить производительность или снизить затраты на облако).
Репатриация данных становится все более и более распространенной, поскольку организации осознают высокую стоимость хранения больших объемов данных в общедоступном облаке. Если вам требуется большое хранилище (например, если у вас есть несколько петабайт неструктурированных данных, к которым вы регулярно обращаетесь), облачное хранилище не так рентабельно, как более традиционные решения.
В среднем облачные варианты стоят в два раза дороже, чем размещение данных на сайте. . Эта статистика остается верной, даже если мы учитываем накладные расходы, необходимые для локального хранилища, в том числе стоимость:
- Персонал, управляющий оборудованием.
- Площадь центра обработки данных.
- Мощность.
- Физическая безопасность.
Основная причина резкой разницы в ценниках – стоимость исходящего трафика. . Провайдеры не взимают плату за загрузку данных, но вы платите за пропускную способность и передачу данных. Передачи, которые отправляют данные за пределы инфраструктуры провайдера, являются дорогостоящими и часто составляют большую часть ежемесячного счета за облако.
Стоимость — не единственная причина, по которой компании выбирают репатриацию данных. Другие распространенные причины включают:
- Новые обновления правил соответствия.
- Проблемы с задержкой в сети.
- Опасения по поводу безопасности облачных вычислений.
- Желание достичь более высокого уровня избыточности данных.
- Частые простои из-за ошибок на стороне поставщика.
- Проблемы с теневыми ИТ (несанкционированное использование общедоступных облачных ресурсов).
- Решение использовать другую модель облачного развертывания.
Преимущества репатриации данных
Как и большинство ИТ-решений, репатриация данных имеет как плюсы, так и минусы. Давайте подробнее рассмотрим наиболее важные преимущества извлечения данных из общедоступного облака.
Снижение затрат и повышение рентабельности инвестиций
Стоимость является основным преимуществом и основной причиной репатриации данных. Хотя установка локального центра обработки данных обходится дорого, затраты на общедоступное облако со временем начинают увеличиваться, поскольку вы ежемесячно платите за:
- Объемы хранилища.
- Экземпляры сервера.
- Услуги на основе использования.
- Стоимость передачи данных (исходное соединение).
- "Скрытые расходы" (недавние исследования показывают, что предприятия тратят более 62 млрд долл. США в год). на общедоступных облачных ресурсах, которые им не нужны и которые они не используют.)
Рано или поздно ваши общие расходы на облачные услуги достигнут стоимости локального хостингового оборудования. . Однако к этому моменту вы уже потратили эти средства на операционные расходы облачных вычислений, и, несмотря на инвестиции, у вас не будет оборудования. С этой точки зрения хостинг на месте дает гораздо более высокую рентабельность инвестиций.
Имейте в виду, что плата за облачное хранилище также непостоянна и ее трудно предсказать. Прогнозируемые расходы быстро превышают бюджет, поскольку:
- Поставщики меняют цены.
- Ваши ИТ со временем нуждаются в изменениях.
- Команды часто недооценивают затраты, связанные с работой в облаке.
- Сложные ИТ-среды, как правило, страдают от теневых ИТ.
При использовании локальной системы хранения затраты не зависят от того, что вы делаете со своими данными. Если ваша ИТ-инфраструктура нуждается в расширении, вам придется инвестировать в дополнительное оборудование, но вы никогда не переборщите со счетом, как это возможно с облачным хранилищем.
Практическая защита ваших данных
Размещение данных в общедоступном облаке означает, что провайдер несет ответственность за хранение и обеспечение безопасности информации. Для некоторых такое решение является находкой, но оно может стать препятствием для компаний, которые ищут более практичный подход к защите данных.
Есть также несколько уникальных проблем, когда вы храните данные в общедоступном облаке:
- Сотни арендаторов (или даже больше) совместно используют общедоступную облачную инфраструктуру, что создает элемент риска, которого нет при размещении внутри компании.
- Недостаточно информации о том, какие элементы управления обеспечивают безопасность облачных данных.
- Команда клиента несет ответственность за использование мер, предоставляемых поставщиком, поэтому существует достаточно места для неправильной настройки (наиболее распространенные ошибки возникают в политиках безопасности облака).
- Провайдер владеет правами на файлы, которые вы храните в общедоступном облаке (если вы не подписываете соглашение об уровне обслуживания, в котором указано иное).
- Общедоступное облако позволяет конечным пользователям получать доступ к данным из любого места, поэтому всегда есть возможность поделиться данными не с теми людьми.
Хотя сбои поставщиков случаются редко, пользователи общедоступных облаков должны знать, что они возможны. В августе 2018 г. из-за ошибки AWS были раскрыты критически важные для бизнеса данные примерно 31 000 систем, принадлежащих GoDaddy. . Если бы компания хранила данные на месте, этого инцидента не произошло бы.
Репатриация данных обеспечивает уровень близости и физического контроля над данными, которые общедоступное облако не может предложить. Вы также ограничиваете поверхность атаки, уменьшая количество событий, которые могут пойти не так с вашими данными. Думайте об этом как о хранении денег в сейфе дома по сравнению с сейфом в банке — банк, конечно, безопасен, но вы не можете сказать, как они защищают сейфы, плюс они являются главной целью для ограблений. С этой точки зрения ваши деньги в большей безопасности дома.
Нет риска привязки к поставщику
Привязка к поставщику происходит, когда компания становится слишком зависимой от облачного провайдера. Если вы храните данные у поставщика слишком долго и строите архитектуру приложения вокруг этого хранилища, блокировка со временем будет естественным образом усиливаться. После этого вы не сможете переключиться на другую платформу (собственную или принадлежащую другому поставщику) без больших затрат на переключение.
Репатриация данных гарантирует, что ваше хранилище никогда не зависит от какого-либо поставщика больше, чем от вашей собственной команды. Ваш персонал управляет набором данных, и нет риска «застрять» с какой-либо третьей стороной.
Уменьшение задержки
В то время как общедоступное облако обеспечивает почти неограниченную емкость хранилища, ваша возможность доступа и использования облачных данных зависит от подключения к Интернету. Операции страдают от задержек, если вы выполняете обработку внутри компании, а подключение к общедоступным облачным данным медленное.
Задержка может не быть проблемой в некоторых случаях использования (например, при резервном копировании и восстановлении или операциях с электронной почтой), но она вредна для некоторых рабочих нагрузок, например:
- Аналитика в реальном времени.
- Приложения кибербезопасности.
- Датчики.
- Приложения Интернета вещей.
Если у вас есть чувствительное к задержкам приложение, которое в значительной степени зависит от набора данных, размещение информации на месте (или использование пограничного сервера) обеспечивает гораздо меньшую задержку, чем использование общедоступного облака. Вы сокращаете путь связи, а внутренняя команда имеет возможность точно настроить ресурсы хранения, вычислений и сети в соответствии с приложением.
Упрощенное соблюдение требований к данным
Поставщики общедоступных облаков (особенно гиперскейлеры) усердно работают над соблюдением государственных и отраслевых требований, таких как HIPAA и PCI. Однако существует серьезная проблема с соблюдением нормативных требований в общедоступном облаке:местоположение данных. . Если ваш бизнес подпадает под действие закона, требующего размещения данных в определенном регионе, использование общедоступного облака может привести к возникновению юридических (и финансовых) проблем.
Вместо того, чтобы настраивать облачные серверы в определенных регионах и полагаться на то, что третья сторона не будет перемещать информацию, некоторые организации предпочитают взять на себя полный контроль и перенести данные в локальную систему.
Недостатки репатриации данных
Вот наиболее заметные проблемы и недостатки репатриации данных:
- Вам придется выделить средства на оборудование, необходимое для размещения данных на месте, независимо от того, какую систему вы решите настроить (частное облако, выделенный сервер, оборудование для совместного размещения и т. д.).
- Вы должны нанять собственную команду для настройки и управления новой ИТ-средой.
- Ваша команда несет единоличную ответственность за настройку защиты и обеспечение безопасности данных на сайте от потенциальных взломов, утечек, кибератак и угроз целостности данных.
- Ваши сотрудники должны обеспечить адекватную доступность данных.
- Если что-то пойдет не так, ваша команда должна решить проблему. У вас нет провайдера, к которому можно было бы обратиться в случае простоя, поэтому убедитесь, что ваша команда знает, как управлять локальными базами данных, прежде чем вы решите извлечь что-либо из общедоступного облака.
- Репатриация данных иногда нарушает взаимопонимание и культуру команды. Некоторым сотрудникам может показаться, что компания делает шаг назад, а вам нужно добавить несколько новых задач в их рабочий день.
- Иногда извлечение данных на месте приводит к снижению скорости или производительности. В этом случае вам придется повторно оптимизировать все службы и рабочие нагрузки, использующие этот набор данных, и этот процесс часто занимает не менее нескольких дней.
- После того как вы покинете общедоступное облако, у вас больше не будет доступа к бесконечным ресурсам по запросу, поэтому попрощайтесь с быстрой подготовкой и мгновенным масштабированием. Вы должны выделить ресурсы и приобрести новое оборудование, если вам требуется больше места для хранения.
Как репатриировать данные?
Контролируйте использование облачных ресурсов и периодически сравнивайте эти затраты с альтернативными методами хранения. Если становится очевидным, что другой тип хранилища предлагает более высокую рентабельность инвестиций для вашего варианта использования, пришло время для репатриации данных. Этот процесс выглядит следующим образом:
- Для начала определите, какие данные вы хотите репатриировать, и обозначьте цель изменения. Собираетесь ли вы на полную репатриацию или частичный подход имеет больше смысла?
- Рассмотрите любые проблемы, связанные с привязкой к поставщику, архитектурой или конечным пользователем, которые могут замедлить или помешать переходу из облака.
- Разбейте план на этапы и установите ключевые показатели эффективности, позволяющие отслеживать ход выполнения.
- Решите, какая среда размещения является оптимальной для ваших данных. Вы хотите вернуть данные в серверную комнату на месте или лучше арендовать выделенный сервер? Или, может быть, лучше использовать гибридное облако?
- Определите уровень навыков вашей команды. В зависимости от того, насколько опытны сотрудники, некоторые варианты хостинга будут более привлекательными, чем другие.
- Проведите подробный анализ затрат и результатов проекта, чтобы оценить финансовые последствия каждой жизнеспособной альтернативы.
- Спланируйте, как команда будет обновлять архитектуру приложения, чтобы данные получили новый дом. Можно ли улучшить производительность или сократить задержки?
- Начните перемещать данные из общедоступного облака. Помните, что перемещение требует времени, и приложения, которые полагаются на рассматриваемые данные, будут отключены во время процесса, если у вас нет резервного хранилища. Холодные архивы, как правило, легче перемещать, чем часто используемые репозитории, поэтому составьте план с наименьшим влиянием на ваш UX.
- Проведите всестороннее тестирование, чтобы убедиться, что все приложения и службы, связанные с набором данных, работают оптимально.
Когда репатриировать данные?
Вы должны репатриировать данные, когда станет очевидным, что отказ от общедоступного облака принесет пользу одному (или нескольким) из следующих направлений бизнеса:
- Ваши итоги.
- Уровни безопасности.
- Производительность службы.
Вот несколько распространенных сценариев, в которых репатриация данных является правильным ходом для бизнеса:
- Счета за облачное хранилище выходят из-под контроля: Начните рассматривать другие варианты хранения, как только счета за общедоступное облако станут выше ожидаемых (или если вы платите за ресурсы, которые не используете).
- Переход на более подходящую среду хостинга: Репатриация данных часто означает, что компания определила лучшее решение для хранения данных для своего варианта использования. Наиболее распространенные проблемы, которые пытаются решить компании, — это проблемы с задержкой и доступностью.
- Новые правила соответствия: Обновления правил вынуждают компании из более строгих отраслей репатриировать данные из общедоступного облака.
- Использование облака исчерпало себя: Общедоступное облако оказывает наиболее значительное влияние на начальных этапах каждого проекта. Как только ваша команда начнет анализировать тенденции использования ресурсов, начните регулярно проводить анализ затрат и результатов, чтобы определить, есть ли необходимость в репатриации данных.
- Быстрое внедрение облачных технологий: Плохое начальное планирование, тактика «подъема и переноса» и отсутствие продуманных планов миграции в облако — вот распространенные причины, по которым данные общедоступного облака возвращаются на место. Помните, что лучше сократить убытки, чем полностью отказаться от неправильного решения для хранения данных.
- Поставщики облачных услуг закрываются: У клиентов нет другого выбора, кроме как отозвать свои данные, если поставщик закрывается. Хотя такие сценарии встречаются редко, у компаний должен быть план аварийного восстановления на случай закрытия поставщика услуг.
Не бойтесь репатриации данных и всегда выбирайте оптимальное решение для хранения
Репатриация данных связана с поиском новых ИТ-возможностей, оптимизацией расходов и повышением производительности приложений. Эти три фактора предшествуют вашей приверженности общедоступному облаку, поэтому убедитесь, что ваша команда всегда рассматривает альтернативы хостинга для каждой базы данных, рабочей нагрузки и службы, работающей в облаке.
Облачные вычисления
- Подзарядка, сброс, перенастройка
- Детка, на улице облачно
- Что входит в SLA облачных сервисов?
- Что такое облачная безопасность и почему она требуется?
- Какая связь между большими данными и облачными вычислениями?
- Конфиденциальность в облачных вычислениях; Все знают
- Убивает ли облако рабочие места в центре обработки данных?
- Как защитить облачные технологии?
- Как управлять рисками облачной безопасности
- 10 преимуществ использования облачного хранилища