| 1 | = Portage !IreneAmd = |
| 2 | |
| 3 | [[TOC(heading=Table of contents,depth=3)]] |
| 4 | |
| 5 | == Validation == |
| 6 | |
| 7 | === IPSLCM6.1.11-LR === |
| 8 | |
| 9 | ||'''Configuration IPSL-CM6-LR''' || |
| 10 | ||'''''Critère contrôlé''''' ||'''''Restart historique''' (H1C=H2C) '' || |
| 11 | ||Résultats || OK || OK || |
| 12 | ||Commentaires || OK pour 5D + 5D = 10D, 1M + 1M +... = 1Y + 1Y || |
| 13 | |
| 14 | La configuration IPSLCM6.1.11-LR a été validée sur 50 ans d'expérience piControl. Un inter-monitoring avec les simulations piControl CMIP6 qui ont tourné sur Curie (TGCC) et Jeanzay (IDRIS) est là : [http://webservices2017.ipsl.fr/interMonitoring/tmp/interMonitoring_plot01_EiRj0s_prod/] |
| 15 | |
| 16 | == Performances == |
| 17 | |
| 18 | === IPSLCM6.1.11-LR === |
| 19 | |
| 20 | A retenir pour IPSLCM6.1.11-LR : |
| 21 | * 20% plus lent que sur Irene-SKL à nombre de coeurs équivalent |
| 22 | * le dépeuplement x2 permet d'aller 60% plus vite |
| 23 | * les noeuds dédiés pour XIOS sont nécessaires lorsqu'il y a beaucoup d'IOs. |
| 24 | |
| 25 | Les détails : |
| 26 | * IOs standards (sans workflow CMIP6) : |
| 27 | * Irene AMD sur 976 coeurs : 17 SYPD |
| 28 | * Irene AMD sur 976 coeurs dépeuplés (= 1952 coeurs) : 28 SYPD |
| 29 | * Rappel : Irene SKL sur 976 coeurs : 21 SYPD |
| 30 | |
| 31 | * IO CMIP6 (sans noeud dediés à XIOS = sur un même noeud il y a des process NEMO et XIOS) |
| 32 | * Irene AMD sur 976 coeurs : 10 SYPD |
| 33 | * Irene AMD sur 976 coeurs dépeuplés x 2 (= 1952 coeurs) : 12 SYPD |
| 34 | * Irene AMD sur 976 coeurs dépeuplés x 4 (= 3904 coeurs) : 13.5 SYPD |
| 35 | |
| 36 | * IO CMIP6 (avec noeud dédies à XIOS = sur un même noeud il n'y a que des process clients ou serveurs) |
| 37 | * Irene AMD sur 976 coeurs : 15 SYPD |
| 38 | * Irene AMD sur 976 coeurs dépeuplés x 2 (= 1952 coeurs) : 24 SYPD |
| 39 | * Rappel : Irene SKL sur 976 coeurs : 19 SYPD |
| 40 | |
| 41 | A noter que les fonctionalités de dépeuplement et d'utilisation de noeuds dédiés pour les serveurs XIOS ont été implémentées dans libIGCM (voir [documentation https://forge.ipsl.jussieu.fr/igcmg_doc/wiki/Doc/ComputingCenters/TGCC/IreneAmd#Useofspecificoptionstoincreasecomputingperformances] |
| 42 | |
| 43 | == Problèmes rencontrés == |
| 44 | |
| 45 | * XIOS : des bloquages ont lieu à l'initialisation et à la finalisation. Le problème vient de la libération des communicateurs qui est "en théorie" une communication globale et donc bloquante. La librairie mpi d'irene-amd semble respecter cette règle alors que la librairie mpi d'irene-skl était moins stricte puisqu'il n'y avait pas de blocage. Ces problèmes de blocage arrivent lorsqu'on utilise plusieurs serveurs XIOS (> 6 serveurs). Ces libérations de communicateurs ont été supprimés dans les versions [https://forge.ipsl.jussieu.fr/ioserver/changeset/1867/XIOS/branchs/xios-2.5] et [https://forge.ipsl.jussieu.fr/ioserver/changeset/1866/XIOS/trunk]. |
| 46 | * Des instabilités sur les performances ont été constatées |
| 47 | |