Changes between Version 44 and Version 45 of Public/User_Guide/OmpSs-2


Ignore:
Timestamp:
Jun 14, 2019, 5:43:58 PM (5 years ago)
Author:
Pedro Martinez-Ferror
Comment:

Legend:

Unmodified
Added
Removed
Modified
  • Public/User_Guide/OmpSs-2

    v44 v45  
    300300`NANOS6=graph taskset -c 12-23 ./03.multisaxpy_task 196608 8192 1`
    301301
    302 This command can take some time.  Once it has finished it should have created a script with the name ''graph-XXXXX-YYYYYYYYY-script.sh'' and a directory ''graph-XXXXX-YYYYYYYYY-components''.  Execute the script by typing:
     302This command can take some time.  Once it has finished it should have created a script with the name ''graph-XXXXX-YYYYYYYYY-script.sh'' and a directory ''graph-XXXXX-YYYYYYYYY-components''.  Execute the script by typing (note that it requires the tool `dot`):
    303303
    304304`bash graph-XXXXX-YYYYYYYYY-script.sh`
     
    309309
    310310which illustrates 24 tasks executed in parallel using 12 threads.
     311
     312
     313== Obtaining statistics ==
     314
     315The visual execution of tasks can be further complemented with statistics.  Run the following command:
     316
     317`NANOS6=stats taskset -c 12-23 ./03.multisaxpy_task 196608 8192 1`
     318
     319will give you the information below:
     320{{{
     321$ NANOS6=stats taskset -c 12-23 ./03.multisaxpy_task 196608 8192 1
     322size: 196608, bs: 8192, iterations: 1, time: 0.000241, performance: 0.815801
     323STATS   Total CPUs      12
     324STATS   Total time      2.42573e+07     ns
     325STATS   Total threads   12
     326STATS   Mean threads per CPU    1
     327STATS   Mean tasks per thread   2.08333
     328
     329STATS   Mean thread lifetime    3.65355e+09     %
     330STATS   Mean thread running time        100     %
     331STATS   Mean effective parallelism      0.123268
     332
     333STATS   All Tasks instances     25
     334STATS   All Tasks mean instantiation time       1445    ns      0.885064        %
     335STATS   All Tasks mean pending time     0       ns      0       %
     336STATS   All Tasks mean ready time       32446   ns      19.8732 %
     337STATS   All Tasks mean execution time   119605  ns      73.2582 %
     338STATS   All Tasks mean blocked time     3702    ns      2.26748 %
     339STATS   All Tasks mean zombie time      6067    ns      3.71604 %
     340STATS   All Tasks mean lifetime 163265  ns
     341
     342STATS   03.multisaxpy_task.cpp:3:13 instances   24
     343STATS   03.multisaxpy_task.cpp:3:13 mean instantiation time     1251    ns      1.75051 %
     344STATS   03.multisaxpy_task.cpp:3:13 mean pending time   0       ns      0       %
     345STATS   03.multisaxpy_task.cpp:3:13 mean ready time     32944   ns      46.0981 %
     346STATS   03.multisaxpy_task.cpp:3:13 mean execution time 31079   ns      43.4884 %
     347STATS   03.multisaxpy_task.cpp:3:13 mean blocked time   0       ns      0       %
     348STATS   03.multisaxpy_task.cpp:3:13 mean zombie time    6191    ns      8.66298 %
     349STATS   03.multisaxpy_task.cpp:3:13 mean lifetime       71465   ns
     350
     351STATS   main instances  1
     352STATS   main mean instantiation time    6089    ns      0.2573  %
     353STATS   main mean pending time  0       ns      0       %
     354STATS   main mean ready time    20505   ns      0.866471        %
     355STATS   main mean execution time        2244241 ns      94.8339 %
     356STATS   main mean blocked time  92553   ns      3.91097 %
     357STATS   main mean zombie time   3108    ns      0.131333        %
     358STATS   main mean lifetime      2366496 ns
     359
     360STATS   Phase 1 03.multisaxpy_task.cpp:3:13 instances   24
     361STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean instantiation time     1251    ns      1.75051 %
     362STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean pending time   0       ns      0       %
     363STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean ready time     32944   ns      46.0981 %
     364STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean execution time 31079   ns      43.4884 %
     365STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean blocked time   0       ns      0       %
     366STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean zombie time    6191    ns      8.66298 %
     367STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean lifetime       71465   ns
     368
     369STATS   Phase 1 instances       24
     370STATS   Phase 1 mean instantiation time 1251    ns      1.75051 %
     371STATS   Phase 1 mean pending time       0       ns      0       %
     372STATS   Phase 1 mean ready time 32944   ns      46.0981 %
     373STATS   Phase 1 mean execution time     31079   ns      43.4884 %
     374STATS   Phase 1 mean blocked time       0       ns      0       %
     375STATS   Phase 1 mean zombie time        6191    ns      8.66298 %
     376STATS   Phase 1 mean lifetime   71465   ns
     377STATS   Phase 1 effective parallelism   0.165278
     378}}}
     379
     380Additionally, you can get information related to hardware counters (PAPI). For this, first load the PAPI module:
     381
     382`module load PAPI/5.6.0`
     383
     384and execute:
     385
     386`NANOS6=stats-papi taskset -c 12-23 ./03.multisaxpy_task 196608 8192 1`
     387
     388to get the following information:
     389{{{
     390$ NANOS6=stats-papi taskset -c 12-23 ./03.multisaxpy_task 196608 8192 1
     391size: 196608, bs: 8192, iterations: 1, time: 0.000236, performance: 0.833085
     392STATS   Total CPUs      12
     393STATS   Total time      3.06985e+07     ns
     394STATS   Total threads   12
     395STATS   Mean threads per CPU    1
     396STATS   Mean tasks per thread   2.08333
     397
     398STATS   Mean thread lifetime    2.88807e+09     %
     399STATS   Mean thread running time        100     %
     400STATS   Mean effective parallelism      0.13271
     401
     402STATS   All Tasks instances     25
     403STATS   All Tasks mean instantiation time       2708    ns      1.52238 %
     404STATS   All Tasks mean pending time     0       ns      0       %
     405STATS   All Tasks mean ready time       9032    ns      5.07761 %
     406STATS   All Tasks mean execution time   162959  ns      91.6123 %
     407STATS   All Tasks mean blocked time     1105    ns      0.621209        %
     408STATS   All Tasks mean zombie time      2075    ns      1.16652 %
     409STATS   All Tasks mean lifetime 177879  ns
     410STATS   All Tasks Real frequency        0.658047        GHz
     411STATS   All Tasks Virtual frequency     0.782649        GHz
     412STATS   All Tasks IPC   1.66625
     413STATS   All Tasks L2 data cache miss ratio      3.203
     414STATS   All Tasks Real nsecs    3804026 nsecs
     415STATS   All Tasks Virtual nsecs 3198406 nsecs
     416STATS   All Tasks Instructions  4171011 instructions
     417STATS   All Tasks Total cycles  2503229
     418STATS   All Tasks Instr completed       4171011
     419STATS   All Tasks L2D cache accesses    16754
     420STATS   All Tasks L2D cache misses      53663
     421STATS   All Tasks Reference cycles      2054784
     422
     423STATS   03.multisaxpy_task.cpp:3:13 instances   24
     424STATS   03.multisaxpy_task.cpp:3:13 mean instantiation time     2498    ns      4.60435 %
     425STATS   03.multisaxpy_task.cpp:3:13 mean pending time   0       ns      0       %
     426STATS   03.multisaxpy_task.cpp:3:13 mean ready time     8237    ns      15.1826 %
     427STATS   03.multisaxpy_task.cpp:3:13 mean execution time 41452   ns      76.405  %
     428STATS   03.multisaxpy_task.cpp:3:13 mean blocked time   0       ns      0       %
     429STATS   03.multisaxpy_task.cpp:3:13 mean zombie time    2066    ns      3.80808 %
     430STATS   03.multisaxpy_task.cpp:3:13 mean lifetime       54253   ns
     431STATS   03.multisaxpy_task.cpp:3:13 Real frequency      3.16748 GHz
     432STATS   03.multisaxpy_task.cpp:3:13 Virtual frequency   3.18873 GHz
     433STATS   03.multisaxpy_task.cpp:3:13 IPC 1.72954
     434STATS   03.multisaxpy_task.cpp:3:13 L2 data cache miss ratio    3.96831
     435STATS   03.multisaxpy_task.cpp:3:13 Real nsecs  755566  nsecs
     436STATS   03.multisaxpy_task.cpp:3:13 Virtual nsecs       750532  nsecs
     437STATS   03.multisaxpy_task.cpp:3:13 Instructions        4139211 instructions
     438STATS   03.multisaxpy_task.cpp:3:13 Total cycles        2393243
     439STATS   03.multisaxpy_task.cpp:3:13 Instr completed     4139211
     440STATS   03.multisaxpy_task.cpp:3:13 L2D cache accesses  13316
     441STATS   03.multisaxpy_task.cpp:3:13 L2D cache misses    52842
     442STATS   03.multisaxpy_task.cpp:3:13 Reference cycles    1964416
     443
     444STATS   main instances  1
     445STATS   main mean instantiation time    7755    ns      0.246588        %
     446STATS   main mean pending time  0       ns      0       %
     447STATS   main mean ready time    28131   ns      0.894488        %
     448STATS   main mean execution time        3079121 ns      97.9076 %
     449STATS   main mean blocked time  27636   ns      0.878749        %
     450STATS   main mean zombie time   2284    ns      0.0726249       %
     451STATS   main mean lifetime      3144927 ns
     452STATS   main Real frequency     0.0360792       GHz
     453STATS   main Virtual frequency  0.0449312       GHz
     454STATS   main IPC        0.289128
     455STATS   main L2 data cache miss ratio   0.238802
     456STATS   main Real nsecs 3048460 nsecs
     457STATS   main Virtual nsecs      2447874 nsecs
     458STATS   main Instructions       31800   instructions
     459STATS   main Total cycles       109986
     460STATS   main Instr completed    31800
     461STATS   main L2D cache accesses 3438
     462STATS   main L2D cache misses   821
     463STATS   main Reference cycles   90368
     464
     465STATS   Phase 1 03.multisaxpy_task.cpp:3:13 instances   24
     466STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean instantiation time     2498    ns      4.60435 %
     467STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean pending time   0       ns      0       %
     468STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean ready time     8237    ns      15.1826 %
     469STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean execution time 41452   ns      76.405  %
     470STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean blocked time   0       ns      0       %
     471STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean zombie time    2066    ns      3.80808 %
     472STATS   Phase 1 03.multisaxpy_task.cpp:3:13 mean lifetime       54253   ns
     473STATS   Phase 1 03.multisaxpy_task.cpp:3:13 Real frequency      3.16748 GHz
     474STATS   Phase 1 03.multisaxpy_task.cpp:3:13 Virtual frequency   3.18873 GHz
     475STATS   Phase 1 03.multisaxpy_task.cpp:3:13 IPC 1.72954
     476STATS   Phase 1 03.multisaxpy_task.cpp:3:13 L2 data cache miss ratio    3.96831
     477STATS   Phase 1 03.multisaxpy_task.cpp:3:13 Real nsecs  755566  nsecs
     478STATS   Phase 1 03.multisaxpy_task.cpp:3:13 Virtual nsecs       750532  nsecs
     479STATS   Phase 1 03.multisaxpy_task.cpp:3:13 Instructions        4139211 instructions
     480STATS   Phase 1 03.multisaxpy_task.cpp:3:13 Total cycles        2393243
     481STATS   Phase 1 03.multisaxpy_task.cpp:3:13 Instr completed     4139211
     482STATS   Phase 1 03.multisaxpy_task.cpp:3:13 L2D cache accesses  13316
     483STATS   Phase 1 03.multisaxpy_task.cpp:3:13 L2D cache misses    52842
     484STATS   Phase 1 03.multisaxpy_task.cpp:3:13 Reference cycles    1964416
     485
     486STATS   Phase 1 instances       24
     487STATS   Phase 1 mean instantiation time 2498    ns      4.60435 %
     488STATS   Phase 1 mean pending time       0       ns      0       %
     489STATS   Phase 1 mean ready time 8237    ns      15.1826 %
     490STATS   Phase 1 mean execution time     41452   ns      76.405  %
     491STATS   Phase 1 mean blocked time       0       ns      0       %
     492STATS   Phase 1 mean zombie time        2066    ns      3.80808 %
     493STATS   Phase 1 mean lifetime   54253   ns
     494STATS   Phase 1 Real frequency  3.16748 GHz
     495STATS   Phase 1 Virtual frequency       3.18873 GHz
     496STATS   Phase 1 IPC     1.72954
     497STATS   Phase 1 L2 data cache miss ratio        3.96831
     498STATS   Phase 1 Real nsecs      755566  nsecs
     499STATS   Phase 1 Virtual nsecs   750532  nsecs
     500STATS   Phase 1 Instructions    4139211 instructions
     501STATS   Phase 1 Total cycles    2393243
     502STATS   Phase 1 Instr completed 4139211
     503STATS   Phase 1 L2D cache accesses      13316
     504STATS   Phase 1 L2D cache misses        52842
     505STATS   Phase 1 Reference cycles        1964416
     506STATS   Phase 1 effective parallelism   0.217033
     507}}}
     508
     509== Tracing with Extrae ==
     510
     511
     512
    311513
    312514