Искусственный интеллект Google генерирует код, который превосходит по производительности программистов-людей
В мае 2017 года команда Google Brain анонсировала новый подход под названием AutoML. Это нейронная сеть-контроллер для разработки архитектуры дочерней модели, которую можно обучить выполнять ту или иную задачу. Проще говоря, это ИИ, способный генерировать собственный ИИ.
Использованный набор данных
Исследователи Google протестировали AutoML на небольших наборах академических данных, таких как Penn Treebank и CIFAR-10. Позже они решили поставить перед AutoML самую сложную задачу на сегодняшний день. На этот раз они протестировали более крупные наборы данных, такие как обнаружение объектов COCO и классификация изображений ImageNet, и результат оказался ошеломляющим.
Люди разработали несколько современных архитектур машинного обучения для работы с большими наборами данных в академических соревнованиях. В рамках изучения переносимых архитектур для масштабируемого распознавания изображений исследователи Google применили AutoML к двум самым популярным академическим наборам данных — COCO и ImageNet. Если вы изначально примените AutoML к этим огромным наборам данных, потребуется несколько месяцев обучения, чтобы получить желаемый результат.
Как это работает?
AutoML построен на алгоритмах обучения с подкреплением и эволюционных алгоритмах. Однако, чтобы применить его к ImageNet, исследователи модифицировали его, чтобы он был более удобен для крупномасштабных наборов данных –
- Изменено пространство поиска, чтобы оно находило лучший слой, который можно гибко объединять несколько раз для создания окончательной сети.
- Поиск архитектуры выполняется на CIFAR-10, и лучшая изученная архитектура передается в систему обнаружения объектов COCO и архитектуру изображений ImageNet. ол>
После этих изменений AutoML смог найти лучшие слои не только для CIFAR-10, но также для обнаружения объектов COCO и классификации ImageNet. Эти два уровня объединены для создания новой архитектуры под названием NASNet. .
Как показано на рисунке, архитектура NASNet (разработанная AutoML) содержит 2 типа уровней – обычный уровень и уровень уменьшения
Источник:исследовательский блог Google
Результаты
NASNet достигла точности прогнозирования 82,7% при классификации изображений ImageNet, что намного лучше, чем предыдущие модели, созданные командой Google Brain. Кроме того, результаты оказались на 1,2 % лучше, чем предыдущие опубликованные и неопубликованные результаты.
Размер NASNet также можно изменить для создания набора моделей, обеспечивающих приличную точность при сохранении низких вычислительных затрат. Например, небольшая версия NASNet обеспечивает точность 74 % (при этом вычислительные затраты сокращаются вдвое), что более чем на 3 % лучше, чем несколько современных моделей того же размера, разработанных для мобильных платформ.
Как вы можете видеть на рисунках, точность NASNet выше, чем у моделей, изобретенных человеком, при различных размерах моделей, включающих различное количество (в миллионах) операций и параметров для классификации изображений ImageNet.
В этой таблице показана производительность поиска архитектуры и других моделей, разработанных человеком, по классификации ImageNet. Mult-Adds означает количество составных операций умножения-накопления для одного изображения.
Обнаружение объектов с помощью Faster-RCNN с NASNet
Исследователи Google перенесли функции, полученные из ImageNet, на обнаружение объектов COCO. В тестах интеграция изученных функций ImageNet с платформой Faster RCNN затмила предыдущую производительность прогнозирования COCO. Самая крупная модель достигла показателя mAP 43,1 %, что примерно на 4 % лучше, чем прошлые результаты современных моделей.
Ссылка: arxiv.org
Исходный код NASNet для классификации изображений и обнаружения объектов доступен на Github.
Что дальше?
Функции, изученные NASNet на COCO и ImageNet, можно повторно использовать для нескольких приложений машинного зрения. Более того, этот подход может научить нас тому, почему определенные типы нейронных сетей работают так хорошо.
AutoML может открыть область машинного обучения для неспециалистов и может использоваться для разработки сложных машин/роботов на базе искусственного интеллекта. Согласно исследованию, искусственный интеллект на этом уровне интеллекта может помочь слабовидящим людям вернуть зрение.
Очевидно, что эту архитектуру можно использовать в беспилотных автомобилях. Вы также можете представить себе систему, помогающую идентифицировать движение транспорта, дорожные опасности и пешеходов. Его также можно использовать в дополненной реальности, чтобы приложения лучше взаимодействовали с окружающей средой. Но, возможно, самые интригующие применения этого ИИ еще предстоит открыть.
Читайте:15 продвинутых проектов в области искусственного интеллекта
В будущем исследовательская группа Google будет работать над анализом и тестированием таких типов компьютерных архитектур, чтобы усовершенствовать и лучше понять их. Если им это удастся, они смогут вдохновить на создание совершенно нового типа нейронных сетей, которые окажут большее влияние на всех.
Промышленные технологии
- Bosch вносит свой вклад в программу Common Vehicle Interface Initiative (CVII)
- Какие нити для 3D-печати самые прочные?
- Латунь и другие медные сплавы, используемые для механической обработки
- Новости воздействия
- Что такое фрезерный станок? - Детали, работа, схема
- 12 передовых решений наблюдения для максимальной безопасности
- Мониторинг состояния помпы с помощью APM Studio (практическое руководство)
- Новый инструмент ДНК предсказывает рост, плотность костной ткани и уровень образования
- Элементы, на которые следует обратить внимание в процессе сборки BGA
- 5 вещей, которые вам нужно знать о концентричности OD/ID