Update README.md

2026-06-09 21:54:37 +01:00 · 2017-07-14 22:56:06 +01:00
parent 2d8aff36fe
commit 169f4b2711
1 changed files with 11 additions and 11 deletions
@@ -327,11 +327,11 @@ This is the default.
 ** Expected Skylake Gold 6148 dual socket (single prec, single node 20+20 cores) performance using NUMA MPI mapping): **

 mpirun -n 2 benchmarks/Benchmark_dwf --grid 16.16.16.16 --mpi 2.1.1.1 --cacheblocking 2.2.2.2 --dslash-asm --shm 1024 --threads 18 
-Average mflops/s per call per node (full): ** 498739 ** 4d vec
-Average mflops/s per call per node (full): ** 457786 ** 4d vec, fp16 comms
-Average mflops/s per call per node (full): ** 572645 ** 5d vec
-Average mflops/s per call per node (full): ** 721206 ** 5d vec, red black
-Average mflops/s per call per node (full): ** 634542 ** 4d vec, red black
+- Average mflops/s per call per node (full):  498739 : 4d vec
+- Average mflops/s per call per node (full):  457786 : 4d vec, fp16 comms
+- Average mflops/s per call per node (full):  572645 : 5d vec
+- Average mflops/s per call per node (full):  721206 : 5d vec, red black
+- Average mflops/s per call per node (full):  634542 : 4d vec, red black



@@ -391,14 +391,14 @@ $@

 Performance:

-** Expected EPYC 7601 Gold 6148 dual socket (single prec, single node 20+20 cores) performance using NUMA MPI mapping): **
+### Expected EPYC 7601 Gold 6148 dual socket (single prec, single node 20+20 cores) performance using NUMA MPI mapping): **

 mpirun  -np 8 ./omp_bind.sh ./Benchmark_dwf --threads 8 --mpi 2.2.2.1 --dslash-unroll --grid 16.16.16.16 --cacheblocking 4.4.4.4
-Average mflops/s per call per node (full): **420235** 4d vec
-Average mflops/s per call per node (full): **437617** 4d vec, fp16 comms
-Average mflops/s per call per node (full): **522988** 5d vec
-Average mflops/s per call per node (full): **588984** 5d vec, red black
-Average mflops/s per call per node (full): **508423** 4d vec, red black
+- Average mflops/s per call per node (full): 420235 : 4d vec
+- Average mflops/s per call per node (full): 437617 : 4d vec, fp16 comms
+- Average mflops/s per call per node (full): 522988 : 5d vec
+- Average mflops/s per call per node (full): 588984 : 5d vec, red black
+- Average mflops/s per call per node (full): 508423 : 4d vec, red black

 ### Build setup for BlueGene/Q