Являются ли Интернет вещей и облачные вычисления будущим данных?
Приблизительно 29 миллиардов подключенных устройств, которые, как ожидается, будут работать к 2022 году, и более 75 миллиардов устройств Интернета вещей (IoT) во всем мире, как ожидается, будут использоваться к 2025 году во всем мире, Интернет вещей является одним из основных факторов, рассматриваемых передовыми предприятиями.
Обилие устройств Интернета вещей, которые используются в настоящее время, предлагает предприятиям обширные объемы данных, которые можно использовать для создания мощных аналитических данных, и ожидается, что в ближайшие годы они будут только расти, - говорит Шивнатх Бабу, технический директор Unravel Data strong> . Однако по мере того, как предприятия развертывают все большее количество интеллектуальных устройств и объем генерируемых данных увеличивается, централизованные облачные системы будут играть фундаментальную роль в обеспечении разумного использования этой информации. Таким образом, распространение Интернета вещей создает серьезные проблемы для DataOps.
Проблемы с обработкой данных
С большим количеством устройств IoT поступают большие объемы и типы данных. Например, устройства IoT могут предоставлять различные типы данных, такие как:продажи клиентов, пройденные километры, координаты GPS, влажность, количество присутствующих людей, скорость автомобиля, температура и качество воздуха. Многие компании испытывают трудности с обработкой сложности и огромного количества данных, создаваемых IoT, и обнаруживают, что их конвейеры данных становятся неэффективными. Для сервисов, управляемых приложениями, которые полагаются на потоковую передачу в реальном времени, это серьезная проблема.
Для этого необходимы персонализированные потоковые приложения в реальном времени, такие как Kafka, Spark, Kudu, Flink или HBase, для управления высокими требованиями к большим данным современных облачных сервисов. При этом для анализа данных потокового трафика и создания статистических функций требуются сложные и ресурсоемкие методы мониторинга.
Хотя аналитики могут применять несколько методов обнаружения одновременно к входящим данным, это неизбежно приводит к сложности и проблемам с производительностью. Это особенно актуально, когда приложения охватывают несколько систем (например, взаимодействуют со Spark для вычислений, с YARN для выделения ресурсов и планирования, с HDFS или S3 для доступа к данным или с Kafka или Flink для потоковой передачи). Эти развертывания могут стать еще более сложными, если они содержат независимые, определяемые пользователем программы, такие как повторная предварительная обработка данных или генерация функций, общие для нескольких приложений.
Стремительный рост Интернета вещей
Чтобы создать облачную инфраструктуру, необходимую для поддержания стремительного роста устройств Интернета вещей, существующие инструменты и процессы управления данными не подходят для этой задачи. Многие компании начинают осознавать необходимость интеграции искусственного интеллекта или машинного обучения, чтобы справиться с проблемой, создаваемой обширными устройствами Интернета вещей.
Эти интеграции расширяют возможности групп данных по осмыслению всех этих данных, обеспечивая интеллектуальные операции с данными, которые снижают нагрузку на ручную сортировку данных. Это помогает быстрее направлять данные в нужное место, идти в ногу с потребностями бизнеса и поддерживать элементы их операций с данными в реальном времени.
Часто в этих сценариях потоковое приложение может отставать в обработке данных в реальном времени, и определение первопричины может быть сложной задачей для такой сложной системы. Таким образом, развертывание данных, основанное на машинном обучении и искусственном интеллекте (ИИ), с гораздо большей вероятностью обеспечит необходимую производительность, предсказуемость и надежность по сравнению с альтернативами.
Чтобы обеспечить эффективный и непрерывный сбор данных с устройств IoT, алгоритмы машинного обучения доказали свою важность в обеспечении возможности тщательного анализа выполнения приложений, определения причины потенциального сбоя и выработки рекомендаций по повышению производительности и использования ресурсов. Еще одно ключевое преимущество заключается в том, что внедрение таких процессов позволяет организациям получать более низкие затраты и повышенную надежность.
Рассмотрите каждый вариант использования
Таким образом, важно рассмотреть каждый отдельный вариант использования и посмотреть, на какую конкретную проблему Интернета вещей он дает ответ. Понимая в первую очередь среду и проблемы, которые она представляет для соответствующей организации, ИТ-группы могут ускорить внедрение необходимых решений. Будь то машинное обучение или искусственный интеллект, развертывание на основе Интернета вещей зависит от расширения группы обработки данных за счет автоматизации для управления возникающей сложностью.
Автор - Шивнатх Бабу, технический директор Unravel Data.
Интернет вещей
- Какие курсы по облачным вычислениям самые лучшие?
- Большие данные и облачные вычисления:идеальное сочетание
- Облако и как оно меняет мир ИТ
- Какая связь между большими данными и облачными вычислениями?
- Использование больших данных и облачных вычислений в бизнесе
- Почему будущее безопасности данных в облаке программируется
- Как облачные провайдеры меняют перспективы управления данными и аналитикой Интернета вещей
- Использование данных Интернета вещей от края до облака и обратно
- Демократизация Интернета вещей
- Будущее интеграции данных в 2022 году и далее