Конфигурируемый аппаратный IP Flex Logix для рабочих нагрузок AI и DSP объединяет FPGA, тензорные блоки и программное обеспечение.

Блог

ДомДом / Блог / Конфигурируемый аппаратный IP Flex Logix для рабочих нагрузок AI и DSP объединяет FPGA, тензорные блоки и программное обеспечение.

Apr 19, 2023

Конфигурируемый аппаратный IP Flex Logix для рабочих нагрузок AI и DSP объединяет FPGA, тензорные блоки и программное обеспечение.

Сегодня мы поговорим об искусственном интеллекте, DSP, FPGA, IP и SoC. Обычно эти

Сегодня мы поговорим об искусственном интеллекте, DSP, FPGA, IP и SoC. Обычно эти вещи не сочетаются друг с другом. Конечно, FPGA использовались для реализации алгоритмов AI и DSP, хотя алгоритмы AI и DSP обычно включают в себя разные виды вычислений. (См. «Краткая история однокристального DSP, часть II».) Проекты DSP в основном остались в реализациях FPGA благодаря обилию умножителей/аккумуляторов (MAC), которые они предоставляют, в то время как обучение искусственного интеллекта перешло на графические процессоры. В наши дни вывод ИИ перешел к множеству аппаратных реализаций, включая расширенные процессоры, специализированные чипы, специальные механизмы ИИ для SoC и даже FPGA. Теперь Flex Logix представила еще одну альтернативу: настраиваемый аппаратный IP, специально разработанный для выполнения рабочих нагрузок AI и DSP.

Компания Flex Logix, основанная в 2014 году, не новичок в сфере настраиваемого аппаратного IP. Компания предлагает IP-панели и программное обеспечение EFLEX для встроенных FPGA (eFPGA) уже почти десять лет. По словам Джеффа Тейта, соучредителя и генерального директора Flex Logix, в настоящее время у компании есть несколько клиентов, связанных с обороной, и более полдюжины коммерческих клиентов с 23 различными чипами в крупносерийном производстве, включающими EFLEX eFPGA. Примеры таких устройств варьируются от высокопроизводительной SoC 5G MIMO от неназванного клиента, которая интегрирует eFPGA 100K-LUT (таблица поиска) вместе с несколькими цифровыми интерфейсами передачи и приема для антенного интерфейса MIMO, до новой линейки небольших и недорогих устройств. ПЛИС Renesas Forge с LUT от 1 до 4 КБ, стоимость которых может составлять менее 50 центов.

Рис. 1. Небольшие и недорогие FPGA Renesas Forge основаны на Flex Logix FPGA IP, а инструменты разработки основаны на инструментах, поставляемых Flex Logix. Изображение предоставлено: Flex Logix

ПЛИС Renesas Forge ведут свое происхождение от устройств Silego, о которых ранее писал мой друг и коллега Макс Максфилд. (См. «Мало что произошло, или это случилось?» и «Renesas анонсирует потрясающее семейство ForgeFPGA».) Dialog Semiconductor купила Silego в 2017 году и, в свою очередь, была куплена Renesas в 2021 году, и именно так Renesas стала поставщиком FPGA. Маленькую рыбу съедает более крупная рыба, а та, в свою очередь, съедается еще более крупной рыбой.

FPGA Renesas предоставляют версию программного обеспечения Flex Logix FPGA непосредственно разработчикам для настройки устройств ForceFlex, что указывает на то, что Flex Logix может предоставлять полезное программное обеспечение непосредственно разработчикам систем. Это важная возможность при выходе на рынок искусственного интеллекта, где вы хотите, чтобы специалисты по обработке данных и программисты, не имеющие опыта разработки аппаратного обеспечения, могли легко использовать ваши продукты.

Во многих отношениях эти новые аппаратные модули Flex Logix InferX прослеживают свое происхождение от модулей eFPGA компании. IP-панели InferX — это защищенные IP, поставляемые Flex Logix заказчику для конкретного узла производства микросхем на конкретном литейном заводе. В этом отношении InferX IP аналогичен IP-адресу EFLEX FPGA компании. В случае с InferX IP Flex Logix изначально нацелен на 5-нм технологический узел TSMC N5, но компания заявляет, что любой процесс FinFET является кандидатом на этот IP.

Кроме того, алгоритмы AI и DSP выполняют большое количество операций умножения/накопления. FPGA, включая плитки Flex Logix eFPGA, обычно предоставляют множество умножителей/аккумуляторов для выполнения всех этих операций в реальном времени, но эти MAC встроены в структуру FPGA, как изюм в вкусном рецепте рисового пудинга моей бабушки в пятницу вечером. которых было относительно немного и они были редкими. В FPGA защищенные MAC-адреса окружены межсоединенной структурой FPGA, что позволяет создать любой тип конвейера выполнения. Однако алгоритмам искусственного интеллекта и DSP не нужна такая гибкость — их вычислительные конвейеры гораздо более регулярны, — поэтому накладные расходы на структуры маршрутизации FPGA излишни и могут быть устранены. По словам Тейта, эти издержки кремния значительны и могут составлять до 80% кремния в области внутри и вокруг MAC.

Вместо этого Flex Logix взяла свой дизайн MAC, усовершенствовала его для операций AI и DSP и создала проводной тензорный блок, который соединяет большое количество MAC с помощью защищенного межсоединения, точно так же, как это было бы спроектировано SoC. Полученный аппаратный IP-тайл InferX объединяет четыре таких тензорных блока с отдельными кэшами SRAM L2 и небольшой eFPGA, которая используется для настройки и соединения тензорных блоков, как показано на рисунке 2 ниже.