Changes between Initial Version and Version 1 of Calculateurs/IreneAmd


Ignore:
Timestamp:
05/13/20 07:57:27 (4 years ago)
Author:
aclsce
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • Calculateurs/IreneAmd

    v1 v1  
     1= Portage !IreneAmd = 
     2 
     3[[TOC(heading=Table of contents,depth=3)]] 
     4 
     5== Validation == 
     6 
     7=== IPSLCM6.1.11-LR === 
     8 
     9||'''Configuration IPSL-CM6-LR''' || 
     10||'''''Critère contrôlé''''' ||'''''Restart historique''' (H1C=H2C) '' || 
     11||Résultats    || OK  || OK ||  
     12||Commentaires || OK pour 5D + 5D = 10D, 1M + 1M +... = 1Y + 1Y  ||  
     13  
     14La configuration IPSLCM6.1.11-LR a été validée sur 50 ans d'expérience piControl. Un inter-monitoring avec les simulations piControl CMIP6 qui ont tourné sur Curie (TGCC) et Jeanzay (IDRIS) est là : [http://webservices2017.ipsl.fr/interMonitoring/tmp/interMonitoring_plot01_EiRj0s_prod/] 
     15 
     16== Performances == 
     17 
     18=== IPSLCM6.1.11-LR === 
     19 
     20A retenir pour IPSLCM6.1.11-LR :  
     21 * 20% plus lent que sur Irene-SKL à nombre de coeurs équivalent 
     22 * le dépeuplement x2 permet d'aller 60% plus vite 
     23 * les noeuds dédiés pour XIOS sont nécessaires lorsqu'il y a beaucoup d'IOs. 
     24 
     25Les détails : 
     26 * IOs standards (sans workflow CMIP6) : 
     27  * Irene AMD sur 976 coeurs : 17 SYPD 
     28  * Irene AMD sur 976 coeurs dépeuplés (= 1952 coeurs) : 28 SYPD  
     29  * Rappel : Irene SKL sur 976 coeurs : 21 SYPD 
     30 
     31 * IO CMIP6 (sans noeud dediés à XIOS = sur un même noeud il y a des process NEMO et XIOS) 
     32  * Irene AMD sur 976 coeurs : 10 SYPD 
     33  * Irene AMD sur 976 coeurs dépeuplés x 2 (= 1952 coeurs) : 12 SYPD 
     34  * Irene AMD sur 976 coeurs dépeuplés x 4 (= 3904 coeurs) : 13.5 SYPD 
     35 
     36 * IO CMIP6 (avec noeud dédies à XIOS = sur un même noeud il n'y a que des process clients ou serveurs) 
     37  * Irene AMD sur 976 coeurs : 15 SYPD 
     38  * Irene AMD sur 976 coeurs dépeuplés x 2 (= 1952 coeurs) : 24 SYPD 
     39  * Rappel : Irene SKL sur 976 coeurs : 19 SYPD 
     40  
     41A noter que les fonctionalités de dépeuplement et d'utilisation de noeuds dédiés pour les serveurs XIOS ont été implémentées dans libIGCM (voir [documentation https://forge.ipsl.jussieu.fr/igcmg_doc/wiki/Doc/ComputingCenters/TGCC/IreneAmd#Useofspecificoptionstoincreasecomputingperformances] 
     42 
     43== Problèmes rencontrés == 
     44 
     45 * XIOS : des bloquages ont lieu à l'initialisation et à la finalisation.  Le problème vient de la libération des communicateurs qui est "en théorie" une communication globale et donc bloquante. La librairie mpi d'irene-amd semble respecter cette règle alors que la librairie mpi d'irene-skl était moins stricte puisqu'il n'y avait pas de blocage. Ces problèmes de blocage arrivent lorsqu'on utilise plusieurs serveurs XIOS (> 6 serveurs). Ces libérations de communicateurs ont été supprimés dans les versions [https://forge.ipsl.jussieu.fr/ioserver/changeset/1867/XIOS/branchs/xios-2.5] et [https://forge.ipsl.jussieu.fr/ioserver/changeset/1866/XIOS/trunk]. 
     46 * Des instabilités sur les performances ont été constatées 
     47