Roofline Model.
Moore's Law
Bill Dally quote.
Taxonomía Flynn: SISD, SIMD, MIMD.
Amdahl's Law vs. Gustafson-Barsis' Law
Nicolás Wolovick 20140327
FLOPS/Intensidad = BW
Si conozco la intensidad aritmética de mi problema la relación entre el BW y FLOPS es lineal.
FLOPS = BW * Intensidad
Limitado por el pico teórico de FLOPS de la máquina.
Ancho de banda de 16 GiB/s.
Performance pico de 16 GFLOPS.
Típico: aumentar cores sin tocar el subsistema de memoria.
Computadora desbalanceada.
Como cambia el modelo según el grado de optimización (FLOP & Memoria).
(Lorena A. Barba, Rio Yokota, How will the fast-multipole method fare in the exascale era?, 2013)
La cantidad de transistores se duplica cada 18 meses.
(Moore, Electronics 38(8) April 19, 1965)
Es una observación de mercado, no una ley de la física.
Nada cambió.
Esta si es una ley de la ¿física? ¿electrónica?
Posibilitó "ley" de Moore se mantuviera a lo largo de los años.
Observar: transistores son más pequeños y densidad de potencia es constante.
MOSFETs continue to function as voltage-controlled switches while all key figures of merit such as layout density, operating speed, and energy efficiency improve – provided geometric dimensions, voltages, and doping concentrations are consistently scaled to maintain the same electric field.
En el 2001 se acabó la veta del ILP.
(Dally, The Last Classical Computer, 2001)
(Gordon Moore, An Update on Moore's Law, Keynote Presentation at ISSCC 2003)
(Herb Sutter, The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software, 2005)
(Bill Dally, Efficiency and Programmability: Enablers for ExaScale)
-
(efficiency IS performance)
-
(locality IS performance)
.
.
(Bill Dally, Efficiency and Programmability: Enablers for ExaScale, SC13)
Comunicación, distancia y potencia en un chip típico de 20mm*20mm=400mm².
(Bill Dally, Efficiency and Programmability: Enablers for ExaScale, SC13)
Si, enseñamos Taxonomía de Flynn en Lic. en Cs. de la Computación.
Gráfico de Guillermo Ortiz, exámen de WHPC13.
…the effort expended on achieving high parallel processing rates is wasted unless it is accompanied by achievements in sequential processing rates of very nearly the same magnitude.
— Gene Amdahl
¡Siempre necesitaremos buena preformance en 1 hilo!
(Wikipedia, Amdahl's Law)
0.25%
(Hennessy, Patterson, CAAQA4, p.202)
AGGGGGGGGGGGG!
La ley de Amdahl's pone límites muy fuertes en la paralelización.
…speedup should be measured by scaling the problem to the number of processors, not by fixing the problem size.
— John Gustafson
Supone que el data-set aumenta linelmente con la cantidad de procesadores.
Although simply scaling the data size with processor count is rarely appropriate, assuming a fixed problem size for a much larger processor count is often inappropriate as well, since it is likely that users given a much larger multiprocessor would opt to run a larger or more detailed version of an application.
(Hennessy, Patterson, CAAQA4, p.259)
El tiempo de procesamiento baja a medida que agregamos "cores" para un problema de tamaño fijo.
El tiempo de procesamiento no aumenta a medida que agregamos "cores" para un problema de tamaño variable.
Table of Contents | t |
---|---|
Exposé | ESC |
Full screen slides | e |
Presenter View | p |
Source Files | s |
Slide Numbers | n |
Toggle screen blanking | b |
Show/hide slide context | c |
Notes | 2 |
Help | h |