Промышленное производство
Промышленный Интернет вещей | Промышленные материалы | Техническое обслуживание и ремонт оборудования | Промышленное программирование |
home  MfgRobots >> Промышленное производство >  >> Industrial Internet of Things >> Интернет вещей

Почему традиционные хранилища данных не справляются с аналитикой в реальном времени

Организации, ориентированные на данные, либо добиваются успеха, либо терпят неудачу в зависимости от своей способности принимать решения на основе самой свежей и актуальной информации. Независимо от того, оптимизируете ли вы цепочки поставок, выявляете мошенничество в финансовых транзакциях или персонализируете обслуживание клиентов в режиме реального времени, актуальность данных имеет первостепенное значение.

Однако для многих организаций этот Святой Грааль «немедленности данных» остается недостижимым. Они продолжают полагаться на традиционные хранилища данных или другие устаревшие хранилища данных — мощные инструменты, созданные для пакетной обработки и исторического анализа, — но плохо оснащены для удовлетворения требований аналитики в реальном времени. Результат? Важные бизнес-решения принимаются на основе устаревших данных, что приводит к упущенным возможностям, неоптимальным результатам и неспособности идти в ногу с конкуренцией.

Если вы находитесь в ситуации, когда актуальность данных имеет решающее значение для вашего варианта использования, и вы все еще используете хранилище данных в качестве основного хранилища аналитики, вы, вероятно, не воспользуетесь всеми преимуществами аналитики в реальном времени. На самом деле вы, вероятно, сталкиваетесь со значительными задержками в передаче данных и эксплуатационными расходами, что делает ваши инициативы по работе с данными в реальном времени неустойчивыми в долгосрочной перспективе.

Хранилище данных никогда не предназначалось для работы в режиме реального времени

Чтобы понять, почему хранилищам данных не хватает аналитики в реальном времени, нам необходимо взглянуть на основные архитектурные различия между этими устаревшими системами и современными базами данных аналитики в реальном времени.

Хранилища данных оптимизированы для пакетной обработки и исторического анализа. Они преуспевают в агрегировании больших объемов данных из различных источников, преобразовании и очистке данных, а затем их загрузке в централизованное хранилище для отчетности и бизнес-аналитики. Этот пакетно-ориентированный подход хорошо работает в случаях, когда своевременность не является критическим фактором, например ежемесячные отчеты о продажах или квартальный финансовый анализ.

Однако внутренняя конструкция хранилища данных приводит к значительной задержке данных. Данные обычно загружаются в хранилище периодически — ежечасно, ежедневно, еженедельно или ежемесячно. Это означает, что к моменту, когда данные становятся доступными для анализа, они уже устаревают, иногда на часы или даже дни. В быстро меняющейся бизнес-среде, где каждая секунда на счету, эта задержка может стать решающим фактором между возможностью воспользоваться возможностью или полностью ее упустить.

Более того, хранилища данных не предназначены для обработки высокоскоростных потоков данных или поддержки запросов с малой задержкой. По мере увеличения объемов данных и параллельной работы пользователей хранилищам данных приходится с трудом обеспечивать время отклика менее секунды, необходимое для принятия решений в реальном времени. Базовые структуры хранения и индексации хранилища данных оптимизированы для массовой загрузки и агрегирования данных, а не для быстрого приема и запроса детальных данных в реальном времени.

Цена устаревших данных

Последствия использования хранилища данных для анализа в реальном времени могут быть серьезными. Рассмотрим следующие сценарии –

В каждом из этих примеров стоимость устаревших данных может измеряться не только потерей дохода и неудовлетворенностью клиентов, но и альтернативной стоимостью упущенных стратегических преимуществ. Организации, которые не могут действовать на основе самой свежей информации, всегда будут отставать от своих более гибких конкурентов.

Более того, эксплуатационные расходы, связанные с поддержанием инфраструктуры аналитики в реальном времени на базе хранилища данных, могут оказаться непомерно высокими. Необходимость в дополнительных процессах ETL, репликации данных и сложных механизмах синхронизации данных создает значительную административную нагрузку и увеличивает совокупную стоимость владения (TCO).

Базы данных аналитики в реальном времени

Чтобы преодолеть ограничения хранилищ данных для сценариев использования в режиме реального времени, организации все чаще обращаются к специализированным базам данных аналитики в реальном времени, таким как Apache Pinot. Эти специализированные решения разработаны с нуля для удовлетворения уникальных требований аналитики с малой задержкой и высоким уровнем параллелизма в отношении быстро меняющихся данных.

В отличие от хранилищ данных, базы данных аналитики в реальном времени, такие как Pinot, оптимизированы для непрерывного приема данных и выполнения запросов в реальном времени. Они могут принимать и индексировать потоки данных за миллисекунды, обеспечивая время ответа на запросы менее секунды даже с миллиардами записей. Это позволяет организациям принимать решения на основе самых свежих данных, раскрывая истинный потенциал аналитики в реальном времени.

Кроме того, базы данных аналитики в реальном времени рассчитаны на горизонтальное масштабирование, обрабатывая растущие объемы данных и одновременное использование пользователей без ущерба для производительности. Эта масштабируемость имеет решающее значение для критически важных приложений, ориентированных на пользователей, где тысячи пользователей могут одновременно запрашивать систему.

Но преимущества баз данных аналитики в реальном времени выходят за рамки просто технических возможностей. Они также предлагают значительные эксплуатационные и экономические преимущества –

Когда лучше выбирать базу данных для анализа в реальном времени, а не хранилище данных

Решение об использовании базы данных аналитики в реальном времени, такой как Apache Pinot, вместо традиционного хранилища данных должно быть основано на тщательной оценке конкретных вариантов использования и требований вашей организации. Как правило, если актуальность данных имеет решающее значение для результатов вашего бизнеса, и вы имеете дело с высокоскоростными потоками данных, база данных аналитики в реальном времени, вероятно, будет лучшим выбором.

Вот несколько распространенных сценариев, в которых может оказаться полезной база данных аналитики в реальном времени:

Напротив, хранилища данных по-прежнему могут быть лучшим выбором для случаев использования, где актуальность данных менее важна, например для исторической отчетности, бизнес-аналитики или рабочих нагрузок обработки данных.

В конечном счете, главное — понять ваши конкретные требования и выбрать правильный инструмент для работы. Попытка принудительно встроить хранилище данных в сценарий использования аналитики в реальном времени неизбежно приведет к неоптимальной производительности, увеличению затрат и упущенным возможностям.

Дальнейшие шаги

Поскольку темпы бизнеса продолжают ускоряться, потребность в анализе данных в режиме реального времени становится как никогда острой. Организации, которые смогут использовать возможности настоящего – способность превращать данные в действия со скоростью мысли – будут процветать в эпоху цифровых технологий.

Чтобы помочь вам глубже погрузиться в эту тему и получить больше ясности, мы подготовили для вас электронную книгу «Адаптируйся или будь впереди:конкурентное преимущество данных в реальном времени». Загрузите его сегодня и докажите в своей организации необходимость внедрения базы данных аналитики в реальном времени, такой как Apache Pinot, в качестве подходящего инструмента для всех ваших потребностей в аналитике в реальном времени, ориентированной на пользователей.


Интернет вещей

  1. Стимулирование конвергенции и взаимодействия для промышленного Интернета вещей и Industrie 4.0
  2. 5 вещей, которые необходимо знать вашей команде разработчиков перед созданием приложения M2M
  3. Защищены ли североамериканские энергокомпании от кибератак?
  4. Секреты инфраструктуры Интернета вещей с умным городом
  5. Пошаговое руководство:как получить данные от ПЛК с помощью IIoT?
  6. Обзор IoT World 2019:треки, динамики и многое другое
  7. Connext DDS + Android
  8. Система обнаружения газа на базе Интернета вещей
  9. Буря - и цифровая сеть
  10. Использование Интернета вещей для развития отраслей и поддержки экономики в целом