Version 21 (modified by mafoipsl, 16 years ago) (diff) |
---|
Rebuild Performances
Cette page rassemble des éléments quantitatifs sur les performances de rebuild sur les différents calculateurs : mercure, mercure-tx7, brodie, idris-tx7, rhodes.
Ceci devrait permettre in fine de trouver le mode de fonctionnement optimum.
rebuild performant installé le 25 février 2008
Installation de rebuild, version performante le 25 février 2008.
sur brodie
Pour l'utiliser, ajouter dans son PATH le répertoire : /home/rech/psl/rpsl035/SX/bin
export PATH=$PATH:/home/rech/psl/rpsl035/SX/bin
sur mercure
Pour l'utiliser, ajouter dans son PATH le répertoire : /home/cont003/p86ipsl/SX/bin
export PATH=$PATH:/home/cont003/p86ipsl/SX/bin
Nouveau flio_rbld 20 février 2008 - IDRIS
$ WORKDIR $ WORKDIR $TMPDIR $TMPDIR nouveau flio_rbld ancien nouveau flio_rbld ancien 57 724 236 octets - TX7 2.79s 2.90 s 1.42 s 1.63 s 57 724 236 octets - SX8 4.05 s 3.98 s 3.36 s 2.93 s 711 676 920 octets - TX7 23.70 s 2 852 s 20.62 s 38.17 s 711 676 920 octets - SX8 28.61 s 42 mn 33 s 25.9 s 1 h 29mn
- Italiques : Anomalies
- Gras : Corrections apportées : nouveau flio_rbld ou file system optimisé
Conclusion
- Le file system $TMPDIR sur TX7 est très rapide
- Le nouveau flio_rbld ne comporte plus d'anomalie et n'est plus sensible à l'organisation du file system : on peut l'utiliser sur brodie directement en attendant la nouvelle frontale IDRIS et le déport des rebuild avec les post-traitements.
Nouveau flio_rbld 20 février 2008 - CCRT
$ LOCALTMPDIR $ $LOCALTMPDIR $TMPDIR $TMPDIR $SCRATCHDIR $SCRATCHDIR nouveau flio_rbld ancien nouveau flio_rbld ancien nouveau flio_rbld ancien 482 751 296 octets - SX8R 13.46s s 16.97 s s 16.01 s s
Couplé IPSLCM4_v2
- Résolution 96x71
- mercure : A cette résolution, sur 4 processeurs (3 pour LMDZ/ORCHIDEE et 1 pour OPA/OASIS), 1 mois prend environ 7mn sur mercure (temps elapsed) et les rebuild (sur mercure) prennent 1 mn.
- brodie : A cette résolution, sur 4 processeurs (3 pour LMDZ/ORCHIDEE et 1 pour OPA/OASIS), 1 mois prend environ 9mn sur brodie (temps elapsed) et les rebuild (sur brodie) prennent 2 mn.
Résolution Machine Fichier Taille des fichiers initiaux Taille du fichier combiné Temps elapsed total 96x71x19 mercure histmth 6786404, 6517600, 6786404 19419796 - = = histday 13883920, 13329420, 13883920 39945024 1mn = brodie histmth 6786400, 6517596, 6786400 19419792 - = = histday 13883916, 13329416, 13883916 39945020 2 mn
- Résolution 144x96
- brodie - tests de l'IDRIS. entre 11 mn et 62 mn. Le minimum est obtenu sur $WORKDIR avec
export F_SETBUF=65536 export NC_BLOCKSIZE=67108864
- Tests effectués :
job.o16806:cd $TMPDIR job.o16806:real 39m6.72s job.o24807:export PATH=/workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin:$PATH job.o24807:cd $TMPDIR job.o24807:real 44m22.09s job.o24807:real 44m22.20s job.o26023:export PATH=/workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin:$PATH job.o26023:cd /workdir/rech/psl/rpsl003/REBUILD/batch job.o26023:real 18m11.19s job.o26023:real 18m11.44s job.o26122:export F_SETBUF=32768 job.o26122:export NC_BLOCKSIZE=33554432 job.o26122:export PATH=/workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin:$PATH job.o26122:cd /workdir/rech/psl/rpsl003/REBUILD/batch job.o26122:real 12m22.29s job.o26122:real 12m22.58s job.o26157:export F_SETBUF=65536 job.o26157:export NC_BLOCKSIZE=67108864 job.o26157:export PATH=/workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin:$PATH job.o26157:cd /workdir/rech/psl/rpsl003/REBUILD/batch job.o26157:real 11m42.92s job.o26157:real 11m43.16s job.o26181:export F_SETBUF=65536 job.o26181:export NC_BLOCKSIZE=67108864 job.o26181:export PATH=/workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin:$PATH job.o26181:cd $TMPDIR job.o26181:real 55m39.79s job.o26181:real 55m39.93s job.o26342:export F_SETBUF=65536 job.o26342:export NC_BLOCKSIZE=67108864 job.o26342:export F_HSDIR job.o26342:export PATH=/workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin:$PATH job.o26342:cd $TMPDIR job.o26342:real 47m49.35s job.o26342:real 47m49.63s job.o26440:export F_FILEINF=DETAIL job.o26440:cd $TMPDIR job.o26440:real 1h2m21.06s job.o26440:real 1h2m21.10s job.o27818:cd $TMPDIR job.o27818:real 53m46.54s
- Tests effectués :
- brodie - tests de l'IDRIS. entre 11 mn et 62 mn. Le minimum est obtenu sur $WORKDIR avec
- brodie - 40 mn sur le fichier histHF en batch et 18 mn en interactif
- batch :
rebuild -o histhf.nc HH202_18610401_18610430_HF_histhf_0000.nc HH202_18610401_18610430_HF_histhf_0001.nc HH202_18610401_18610430_HF_histhf_0002.nc HH202_18610401_ 18610430_HF_histhf_0003.nc HH202_18610401_18610430_HF_histhf_0004.nc real 39m6.72s user 0m1.44s sys 0m38.04s
prof /workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin/flio_rbld mon.out + prof /workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin/flio_rbld mon.out %Time Seconds Cumsecs #Calls msec/call Name 49.4 6.84 6.84 50336 0.1360 read 38.9 5.39 12.23 45856 0.1174 write 7.9 1.09 13.32 46551 0.0234 lseek 1.3 0.19 13.51 get_user_chunk_size 0.9 0.12 13.63 fill_NC_var 0.4 0.06 13.69 nc_put_vara_float 0.3 0.04 13.73 _mcount 0.3 0.04 13.77 195320 0.0002 _VEC_memcpy 0.1 0.02 13.79 ncx_putn_float_float 0.1 0.02 13.81 144663 0.0001 strlen 0.1 0.02 13.83 f_copyback 0.1 0.02 13.85 ncx_howmany 0.0 0.00 13.85 32 0.2 brk 0.0 0.00 13.85 33 0.0 stringop.strlowercase_ 0.0 0.00 13.85 1 0. fliocom.fliocrfd_
- interactif :
real 18m15.19s user 0m1.43s sys 4m2.66s
Prof : prof /workdir/rech/psl/rpsl003/IOIPSL_PLUS/modipsl/bin/flio_rbld mon.out %Time Seconds Cumsecs #Calls msec/call Name 47.5 12.98 12.98 45856 0.2831 write 46.6 12.72 25.70 50336 0.2527 read 4.2 1.13 26.84 46551 0.0244 lseek 0.9 0.24 27.08 get_user_chunk_size 0.1 0.04 27.12 fill_NC_var 0.1 0.04 27.16 ncx_putn_float_float 0.1 0.04 27.20 nc_put_vara_float 0.1 0.02 27.22 ncx_howmany 0.1 0.02 27.24 f_cpyin 0.1 0.02 27.26 f_arydsc 0.1 0.02 27.28 _mcount 0.1 0.02 27.30 f_copyback 0.0 0.00 27.30 7 1. close 0.0 0.00 27.31 32 0.2 brk 0.0 0.00 27.31 33 0.0 stringop.strlowercase_ 0.0 0.00 27.31 41 0.0 fliocom.fliodv_rnd_ ...
- batch :
- zahir
- batch :
real 0m15.50s user 0m0.38s sys 0m0.12s
- batch :
- mercure : 17 mn dans $TMPDIR, 47 sec dans $LOCALTMPDIR
- batch $LOCALTMPDIR :
real 0m46.50s user 0m1.53s sys 0m41.12s prof /workdir/p86maf/IOIPSL_PLUS/modipsl/bin/flio_rbld mon.out + prof /workdir/p86maf/IOIPSL_PLUS/modipsl/bin/flio_rbld mon.out %Time Seconds Cumsecs #Calls msec/call Name 92.0 38.65 38.65 96215 0.4017 syscall 6.0 2.51 41.16 142733 0.0176 lseek 0.6 0.26 41.42 get_user_chunk_size 0.6 0.26 41.68 fill_NC_var 0.2 0.08 41.76 50336 0.0016 read 0.1 0.06 41.82 45879 0.0013 write 0.1 0.04 41.86 _mcount 0.0 0.02 41.88 f_cpyin 0.0 0.02 41.90 ncx_putn_float_float 0.0 0.02 41.92 195473 0.0001 _VEC_memcpy 0.0 0.02 41.94 f_copyback 0.0 0.02 41.96 nc_put_vara_float 0.0 0.02 41.98 396 0.05 fliocom.fliopv_r43_ 0.0 0.00 41.99 sigset 0.0 0.00 41.99 7 1. close 0.0 0.00 42.00 23 0.2 llseek 0.0 0.00 42.00 33 0.0 stringop.strlowercase_
- batch $TMPDIR :
real 17m13.50s user 0m1.62s sys 3m12.15s prof /workdir/p86maf/IOIPSL_PLUS/modipsl/bin/flio_rbld mon.out + prof /workdir/p86maf/IOIPSL_PLUS/modipsl/bin/flio_rbld mon.out %Time Seconds Cumsecs #Calls msec/call Name 82.7 18.29 18.29 96215 0.1901 syscall 13.6 3.02 21.31 142733 0.0211 lseek 1.2 0.26 21.57 fill_NC_var 0.7 0.16 21.73 get_user_chunk_size 0.6 0.14 21.86 50336 0.0028 read 0.3 0.06 21.92 45879 0.0013 write 0.2 0.04 21.97 _mcount 0.2 0.04 22.01 ncx_howmany 0.1 0.02 22.03 11021 0.0018 _real_malloc 0.1 0.02 22.05 fy_chtrim 0.1 0.02 22.07 ncx_putn_float_float 0.1 0.02 22.09 4256 0.005 _VEC_memset 0.1 0.02 22.11 195473 0.0001 _VEC_memcpy 0.0 0.00 22.11 33 0.0 stringop.strlowercase_ 0.0 0.00 22.11 1 0. fliocom.fliocrfd_ 0.0 0.00 22.11 41 0.0 fliocom.fliodv_rnd_
- batch $LOCALTMPDIR :
- Résolution 144x142
- brodie : A cette résolution, sur 6 processeurs (5 pour LMDZ/ORCHIDEE et 1 pour OPA/OASIS), 1 mois prend 48 mn sur brodie (temps elapsed) et les rebuild 90 mn (/tmpdir)! Prend 45 mn sur /workdir.
- mercure : A cette résolution, sur 6 processeurs, l'ensemble des rebuild (histmt, histrac, histda histhf) prend 3 mn.
Résolution Machine Fichier Taille des fichiers initiaux Taille du fichier combiné Temps elapsed 144x142x19 brodie histmth 12162628, 11759424, 11759424, 11759424, 12162628 57724284 1 mn = = histday 24974064, 24142316, 24142316, 24142316, 24974064 118961192 7 mn-10 mn = = histrac 6459092, 6244240, 6244240, 6244240, 6459092 30736972 1 mn = = histhf 149316592, 144339948, 144339948, 144339948, 149316592 711676968 79 mn (33 mn en /workdir) = = sechiba_out 2787544, 2695380, 2695380, 2695380, 2787544 13201680 1 mn 144x142x19 mercure histmth + histday +histrac +histhf > 930 Mo 3 mn
- Petit fichier histmth:
- essai en interactif sur brodie01 :
brodie01 - /workdir/rech/psl/rpsl003/REBUILD/test : time rebuild -o histmth.nc histmth_*.nc real 0m2.29s user 0m0.88s sys 0m0.46s
- essai en interactif sur zahir/$WORKDIR :
zahir001-rpsl003 : time rebuild -o histmth.nc histmth_* real 0m5.97s user 0m0.81s sys 0m1.64s
- essai en batch sur zahir/$TMPDIR ( 57 724 236 octets ) :
real 0m25.37s user 0m0.47s sys 0m1.05s
- essai en batch sur zahir/$TMPDIR ( 711 676 920 octets ) :
real 3m32.31s user 0m4.55s sys 0m10.38s
- essai en batch sur zahir/$WORKDIR ( 57 724 236 octets ) :
real 0m4.90s user 0m0.49s sys 0m0.79s
- essai en batch sur zahir/$WORKDIR ( 711 676 920 octets ) :
real 29m59.15s user 0m7.06s sys 1m6.83s
- 22 février 2008 - essai en batch sur zahir/$TMPDIR ( 57 724 236 octets ) :
real 3m29.29s user 0m0.41s sys 0m1.24s
- 22 février 2008 - essai en batch sur zahir/$TMPDIR ( 711 676 920 octets ) :
real 3m16.44s user 0m3.42s sys 0m7.70s
- 22 février 2008 - essai en batch sur zahir/$WORKDIR ( 57 724 236 octets ) :
real 3m9.21s user 0m0.40s sys 0m1.14s
- 22 février 2008 - essai en batch sur zahir/$WORKDIR ( 711 676 920 octets ) :
real 3m30.91s user 0m3.44s sys 0m7.41s
- essai en interactif sur rhodes/$WORKDIR :
rhodes - /workdir/rech/psl/rpsl003/REBUILD : time rebuild -o histmth.nc histmth_*.nc real 0m56.71s user 0m10.34s sys 0m3.81s
- essai en interactif sur idris-tx7/$WORKDIR ( 57 724 236 octets ) :
brodie - /workdir/rech/psl/rpsl003/REBUILD/test : time rebuild -o histmth.nc histmth_000?.nc real 0m2.890s user 0m1.514s sys 0m0.522s
- essai en batch sur idris-tx7/$WORKDIR ( 57 724 236 octets ) :
2.82s real 1.35s user 0.45s system
- 18-02-2008 : essai en batch sur idris-tx7/$TMPDIR ( 57 724 236 octets ) :
1.28s real 0.97s user 0.30s system
- essai en interactif sur brodie01 :
- Fichier histhf :
- essai en interactif sur idris-tx7/$WORKDIR ( 711 676 920 octets ) :
brodie - /workdir/rech/psl/rpsl003/REBUILD/test : time rebuild -o histhf.nc histhf_000?.nc real 37m11.412s user 0m25.349s sys 15m4.097s
- essai en batch sur idris-tx7/$WORKDIR ( 711 676 920 octets ) :
2591.00s real (43mn) 22.66s user 804.80s system
- 18-02-2008 : essai en batch sur idris-tx7/$TMPDIR ( 711 676 920 octets ) :
37.65s real 16.57s user 5.96s system
- essai en interactif sur idris-tx7/$WORKDIR ( 711 676 920 octets ) :
Tests sur mercure
Voici plusieurs tests réalisés sur mercure.
A chaque fois il s'agit de reconstruire un fichier de données inca_avgr.nc de taille 772M coupé en 6 (6x 140M)
- essai en interactif sur le scratchdir/ :
elapsed time (s) : 1.3337 e+03 cpu time (s) : 7.2045 e+02
- essai en batch sur le $LOCALTMPDIR
Real Time (sec) : 67.379782 User Time (sec) : 4.167928 Sys Time (sec) : 62.203794
- essai en batch sur le scratchdir/
Real Time (sec) : 1069.691442 User Time (sec) : 4.132475 Sys Time (sec) : 216.605864
- essai en batch sur mercure. Version revue le 25 février 2008. Fichiers résultats de : 482 751 296 octets
- $LOCALTMPDIR : 0m13.46s
- $TMPDIR : 0m16.97s
- $SCRATCHDIR : 0m16.01s
Tests sur platine
Voici plusieurs tests réalisés sur platine.
A chaque fois il s'agit de reconstruire un fichier de données inca_avgr.nc de taille 772M coupé en 6 (6x 140M)
- essai en interactif/batch sur le scratchdir :
Real Time (sec) : 683.84 User Time (sec) : 8.08 Sys Time (sec) : 202.37
- essai en interactif/batch sur le home :
Real Time (sec) : 77.33 User Time (sec) : 6.74 Sys Time (sec) : 6.02