Nicolás Wolovick 20200515
1 zx81:$ cat /sys/devices/system/cpu/cpu*/cache/index*/coherency_line_size | sort | uniq -c
2 112 64
Todos los niveles de caché tienen líneas de 64 bytes.
1 #pragma omp parallel sections
2 {
3 #pragma omp section
4 {
5 for (size_t i=0; i<N/2; ++i) {
6 sum[0] += i;
7 }
8 }
9 #pragma omp section
10 {
11 for (size_t i=N/2; i<N; ++i) {
12 sum[OFFSET] += i;
13 }
14 }
15 }
OFFSET
de 1 a 15 y ver que pasa.-O0
o usa registros para acumular y chau false-shaing.Core 2 Duo (Penryn)
i7 980 (Gulftown, 32nm shink de Nehalem)
2 * E5-2680v2
Notar numeración "Intel", primero los físicos, luego los lógicos.
1 $ lstopo -i topo_7210_knl.xml
Son 32 módulos de dos 2*VPU (vector processing units)
Dos niveles
.
.
.
Optimizing Linux for AMD EPYC™ 7002 Series Processors with SUSE Linux Enterprise 15 SP1, 2021
¿Cómo transformar una máquina NUMA en UMA?
Table of Contents | t |
---|---|
Exposé | ESC |
Full screen slides | e |
Presenter View | p |
Source Files | s |
Slide Numbers | n |
Toggle screen blanking | b |
Show/hide slide context | c |
Notes | 2 |
Help | h |