Cargando Eventos

Título: Avances en el uso eficiente de sistemas multi-softcores en FPGAs

Directores: David González Márquez y Esteban Mocskos

Lugar: https://youtube.com/live/SzvOVCY4q3s

Resumen
=======
Desde hace años, el avance tecnológico en la fabricación de circuitos integrados ha permitido implementar múltiples procesadores en una misma pastilla con una creciente cantidad de núcleos, memoria e, inclusive, contener unidades funcionales con distinto grado de especialización. Sin embargo, a la hora de resolver problemas específicos, los procesadores de propósito general pueden ser superados por aceleradores, que son sistemas especialmente diseñados. Los más comunes son los aceleradores de vídeo que permiten, por ejemplo, procesar imágenes o descomprimir un flujo (stream) de vídeo de forma muy eficiente.
Las FPGAs (Field-Programmable Gate Array) surgen como plataformas que permiten implementar soluciones de hardware programable, es decir, hardware que puede ser modificado o rediseñado por el usuario sin necesidad de reemplazar el circuito integrado. Consisten en una grilla de celdas de distinta especialización que pueden conectarse de diversas formas, resultando en una plataforma con alta flexibilidad.
Las FPGAs resultan un camino válido para el diseño, prototipado y construcción de hardware y, en particular, aceleradores. Siempre dentro de sus limitaciones de recursos, permiten implementar hardware y se puede lograr un alto grado de paralelismo.
Dado este nivel de flexibilidad, un componente que se implementa en FPGA recibe el nombre de softcore. Estos pueden ir desde una máquina de estados o un sumador, hasta procesadores multi-core con varios niveles de cache. El límite dependerá de la cantidad de celdas y las formas de conexión disponibles, que es fija para una FPGA dada.
El presente trabajo busca avanzar en técnicas que permitan el uso eficiente de múltiples softcores dentro de una FPGA, proponiendo un framework que permitirá estudiar distintos sistemas de procesamiento. Haremos especial uso del MicroBlaze, uno de los softcores más utilizados, desarrollado por Xilinx y creado específicamente para su uso en FPGAs.
Una de las principales limitaciones de los sistemas basados en softcores es el acceso a memoria. Partiendo de este punto y utilizando bloques RAM de FPGA (BRAM), se propone estudiar un conjunto de estrategias de uso de la memoria: usar el stack en BRAM, correr código del programa en BRAM, y correr código de funciones de sincronización en BRAM.
Esto implica ejecutar programas cuyos accesos a memoria utilizan distintas memorias, cada una con características distintas (BRAM y Cache+DDR).
Respecto a las tres formas de uso de BRAM propuestas, notamos que mover y correr código de funciones de sincronización en BRAM no genera mejoras significativas salvo en casos donde hay muchos llamados o varios procesadores en espera. Dependiendo del algoritmo y su implementación, usar el stack en BRAM puede ir desde tener poco efecto a tener un impacto significativo en el desempeño, por encima de mover las funciones de sincronización.
Finalmente, mover y correr código del algoritmo en BRAM genera el mayor impacto positivo en el rendimiento. Este impacto puede verse reducido si  hay partes del código de uso frecuente que no se han movido a BRAM y continúan en memoria principal.
Tener control del hardware nos permite implementar soluciones que se ajusten al problema a resolver. Trabajar desde una capa de abstracción baja implica que los desarrolladores deben manejar detalles de muy bajo nivel, como los procesadores mismos, su interconexión, y la distribución de memoria utilizando distintos tipos de memoria.

Palabras claves: FPGA, SMP, BRAM, softcore, MicroBlaze, memoria, cache, stack, spin-lock, performance.