ИИ может читать исследовательские статьи и предоставлять краткое содержание на английском языке
- Исследователи разрабатывают новую нейронную сеть на основе ранее неисследованной идеи - ротации.
- Он может заменить существующие методы для решения реальных проблем, таких как резюмирование текста, языковое моделирование и ответы на вопросы.
В исследовательской статье обычно используются специализированные подходы и техническая терминология, что затрудняет понимание читателями без научного опыта.
Недавно ученые Массачусетского технологического института и Катарского исследовательского института вычислительной техники разработали новую модель искусственного интеллекта (ИИ), которая позволяет читать научные журналы и предоставлять краткое изложение на простом английском языке в двух предложениях.
Хотя он дает гораздо лучшие результаты, чем предыдущие методы, он определенно не может заменить научных писателей и редакторов. Однако этот ИИ может помочь авторам сканировать большее количество журналов и понимать, о чем они пишут.
Изначально исследовательская группа пыталась разработать нейронные сети для решения определенных физических проблем, например, того, как свет ведет себя в сложных инженерных материалах.
Вскоре они поняли, что ту же методологию можно использовать для решения других сложных вычислительных задач, таких как распознавание речи и интерпретация естественного языка, гораздо более эффективными способами, чем существующие методы машинного обучения.
Что они на самом деле сделали?
За последние несколько лет рекуррентная нейронная сеть (RNN) превратилась в стандартную искусственную нейронную сеть для решения широкого круга задач, от языкового моделирования до суммирования текста и разработки систем чат-ботов.
Были разработаны различные методы для улучшения возможности сопоставления информации из длинной строки данных. Самыми популярными из них являются Long Short-Term Memory (LSTM) и Gated Recurrent Units (GRU). Но они по-прежнему не демонстрируют впечатляющих возможностей памяти или эффективного отзыва на синтетических задачах.
Вот почему исследователи разработали альтернативный подход под названием «Вращательная единица памяти» (RUM). В отличие от традиционных нейронных сетей, основанных на умножении матриц, RUM основан на вращении векторов в многомерном пространстве.
Ссылка:MIT Press Journals | doi:10.1162 / tacl_a_00258 | Массачусетский технологический институт
Он использует вектор в многомерном пространстве (определенная линия, указывающая в определенном направлении) для представления каждого отдельного слова в тексте. Каждое последующее слово направляет вектор в определенном направлении в теоретическом пространстве, которое может содержать тысячи измерений. Результирующий вектор (или группа векторов) затем преобразуется обратно в связанную с ним строку слов.
В целом, RUM делает две вещи:запоминает сложную последовательную динамику и точно воспроизводит информацию. Он также показывает многообещающие характеристики для моделирования языка на уровне персонажей и ответов на вопросы.
Тестирование
Исследователи протестировали эту систему в многочисленных научных статьях, в том числе в их собственной статье, описывающей эти результаты, и сравнили результаты с традиционными нейронными сетями на основе LSTM и GRU.
Вместо того, чтобы просто сканировать аннотации, RUM читает всю статью, чтобы составить простое резюме их содержания. Резюме, составленное этой системой, содержало меньше технических терминов и повторяющихся слов. Хотя это и не было изящной прозой, она все же затрагивает ключевые моменты данных.
Прочтите:AI пишет свои собственные стихи, напоминающие произведения Шекспира
Вы можете опробовать эту систему на своих задачах:код и демонстрация доступны на GitHub.
Промышленные технологии
- Сводка R, L и C
- VR и AR могут изменить обучение в сфере производства
- Искусственная нейронная сеть может улучшить беспроводную связь
- ИИ теперь может обнаруживать и наносить на карту неформальные поселения в мире
- Искусственный интеллект может генерировать речь на основе нейронной активности
- Как ИИ и блокчейн могут минимизировать сложность поставщиков
- FR4:Когда вы можете его использовать, а когда нет
- Что такое нейронные сети и их функции
- Что такое интероперабельность и как моя компания может ее достичь?
- Как автомат по продаже чипсов может обеспечить вас горячими и свежими чипсами?