Cosas para hacer
- Paralelizar la mayor parte del tiempo de cómputo de su aplicación con CUDA.
Entrega
Presentación de los resultados en clase (10 minutos) e informe breve.
- Explicación de las estrategias intentadas y la implementación final.
- Gráficas para distintos tamaños del problema (si influyen) de la métrica de performance seleccionada, comparando también contra la mejor implementación obtenida anteriormente.
- Roofline de la configuración más veloz obtenida.
- Análisis de los resultados obtenidos.
- Potenciales mejoras en la paralelización.