Байт

Новости

ДомДом / Новости / Байт

Sep 26, 2023

Байт

В то время как алгоритмы искусственного интеллекта (ИИ) работают на более крупных и мощных

Хотя алгоритмы искусственного интеллекта (ИИ), работающие на более крупном и мощном оборудовании, часто привлекают к себе внимание, значение периферийного ИИ не следует недооценивать. Edge AI подразумевает развертывание алгоритмов искусственного интеллекта на локальных устройствах, таких как смартфоны, камеры, датчики и другие устройства Интернета вещей, вместо того, чтобы полагаться исключительно на облачные решения. Этот децентрализованный подход предлагает множество преимуществ и открывает широкий спектр возможных приложений.

Одним из основных преимуществ периферийного ИИ является снижение задержки. Обрабатывая данные локально на самом устройстве, периферийный ИИ устраняет необходимость обращения к облаку, что приводит к сокращению времени отклика. Эта возможность работы в режиме реального времени имеет решающее значение в сценариях, где жизненно важно немедленное принятие решений, например, с автономными транспортными средствами, промышленной автоматизацией и мониторингом критической инфраструктуры. Кроме того, пограничный ИИ повышает конфиденциальность и безопасность, поскольку конфиденциальные данные остаются на локальном устройстве, что снижает риск утечки данных и обеспечивает конфиденциальность пользователя.

Несмотря на многочисленные преимущества, запуск более ресурсоемких алгоритмов, таких как обнаружение сложных объектов или модели глубокого обучения, на периферийных устройствах представляет собой серьезную проблему. Периферийные вычислительные устройства часто имеют ограниченную вычислительную мощность, память и энергетические ресурсы по сравнению с облачным оборудованием. Нахождение баланса между точностью алгоритма и ограничениями устройства становится решающим фактором для обеспечения эффективной работы. Чтобы эти алгоритмы хорошо работали на периферийных устройствах, необходимы такие оптимизации, как сжатие модели, квантование и эффективные методы вывода.

Поскольку понимание и распознавание объектов на изображениях или видео является фундаментальной задачей визуального восприятия, алгоритмы обнаружения объектов имеют особое значение в различных отраслях и приложениях. Большие успехи были достигнуты в адаптации моделей обнаружения объектов к периферийным устройствам с ограниченными ресурсами, например, алгоритм FOMO Edge Impulse, который работает до 30 раз быстрее, чем MobileNet SSD, но требует менее 200 КБ памяти для многих случаев использования. Но в таких важных и разнообразных областях применения есть много возможностей для дальнейшего развития.

Последним участником этой области стала команда исследователей из Центра проектного обучения в ETH Zurich. Они разработали очень гибкую, эффективно использующую память и сверхлегкую сеть обнаружения объектов, которую они называют TinyissimoYOLO. Оптимизации, примененные к этой модели, делают ее хорошо подходящей для работы на маломощных микроконтроллерах.

TinyissimoYOLO — это сверточная нейронная сеть (CNN), основанная на архитектуре популярного алгоритма YOLO. Он был построен из квантованных сверточных слоев с ядрами 3 x 3 и полностью связным выходным слоем. Как сверточные, так и полностью связанные линейные слои тщательно оптимизированы в аппаратных и программных инструментах современных устройств, что дает TinyissimoYOLO прирост с точки зрения скорости и эффективности. Это обобщенная сеть обнаружения объектов, которая может применяться для широкого круга задач и требует не более 512 КБ флэш-памяти для хранения параметров модели.

Модель может быть развернута практически на любом оборудовании, отвечающем ее весьма скромным требованиям, включая платформы с процессорами Arm Cortex-M или аппаратными ускорителями искусственного интеллекта. С TinyissimoYOLO был протестирован широкий спектр устройств, включая Analog Devices MAX78000, Greenwaves GAP9, Sony Spresense и Syntiant TinyML.

Оценивая свои методы, команда обнаружила, что они могут запускать обнаружение объектов на плате MAX78000 со скоростью ошеломляющих 180 кадров в секунду. И эта превосходная производительность достигается при сверхнизком энергопотреблении — всего 196 мкДж на вывод. Конечно, все это не имеет значения, если модель не работает должным образом. Но что удивительно, эта крошечная модель также работала сравнимо с гораздо более крупными алгоритмами обнаружения объектов.

Однако, чтобы совершить такой подвиг, естественно, необходимо срезать некоторые углы. Например, входной размер изображения ограничен 88 x 88 пикселей. Этого разрешения недостаточно для многих целей. Кроме того, поскольку проблема обнаружения мультиклассовых объектов усложняется по мере увеличения количества объектов, поддерживается максимум три объекта на изображение.