Changes between Version 43 and Version 44 of IntegrationOpenMP


Ignore:
Timestamp:
09/19/12 11:47:46 (12 years ago)
Author:
acosce
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • IntegrationOpenMP

    v43 v44  
    1616 * Entêtes et commandes curie : [wiki:IntegrationOpenMP/EnteteCommandesCurie] 
    1717 
    18 == Evolution du travail == 
     18== Intégration dans libIGCM - Evolution du travail == 
    1919 
    2020=== Exemple de config.card === 
     
    9494 1. On peut aussi utiliser la bibliothèque numactl qui permet un déploiment très précis des tâches en fonction des architectures (pour les experts).  
    9595 
    96 === LMDZ === 
    97  
    98  Voir : http://lmdz.lmd.jussieu.fr/utilisateurs/distribution-du-modele/versions-intermediaires/lmdz5-trunk-revision-1575 
    9996 
    10097 
    101 === Liste des tests recommandés pour valider le MPI/OpenMP === 
    102  
    103  1. compilation avec OpenMP (voir /work/cont003/p86manci/LMDZ4_OR_OMP/config/LMDZ4OR_v3/AA_Make) 
    104    1. 8MPI + 1OMP = 1 noeud et 8 coeurs 
    105    1. 2MPI + 4OMP = 1 noeud et 8 coeurs 
    106    1. 8MPI + 4OMP   = 4 noeuds et 32 coeurs 
    107  
    108  1. compilation sans OpenMP (voir /work/cont003/p86manci/LMDZ4_OR/config/LMDZ4OR_v3/AA_Make) 
    109    1. 8MPI + "0OMP" = 1 noeuds et 8 coeurs 
    110  
    111 === Comment vérifier le bon fonctionnement de la parallélisation ? === 
    112 ==== sous linux ==== 
    113 Sur des PC sous linux, on peut aussi utiliser les utilitaires suivants : 
    114  1. pidstat -p 12001 -t 1 4 
    115  1. top : Deux raccourcis sont à retenir pour visualiser les tâches sur l'ensembles des processus : 
    116  * "1" donne la visualisation de la charge de tous les coeurs 
    117  * "H" donne la visualisation des tâches dans la liste. 
    118  1. htop permet aussi de bien visualiser les tâches OpenMP avec l'arbre d'héritage.  
    119  
    120 ==== sur titane ==== 
    121 Vous allez dans le répertoire SCRATCH de vos simulation (si il est accessible). Par exemple : [[BR]] 
    122 /scratch/cont003/p86manci/LMDZOR/LOOMP32.5093 [[BR]] 
    123 Le fichier "hosts" contenu dans ce répertoire contien la liste des noeuds et le nombre des tâches par noeuds de calcul.  [[BR]] 
    124 On peut alors se connecter en intéractif sur l'un des noeuds : [[BR]] 
    125 > ssh titane107 [[BR]] 
    126 et éxécuter la commande top. 
    127  
    128 === Tests LMDz sans physique sur vargas === 
    129  
    130 Ces tests sont réalisés par Ehouarn Millour. Il compile sa version (trunk LMDZ5) en mode dev. 
    131 Un résumé de ces tests est là : [http://lmdz.lmd.jussieu.fr/trac/ticket/35 ticket LMDz 35]. 
    132  
    133 === Tests LMDZ4_AR5 sur Titane (juin 2011) ===  
    134 Ces tests utilisent LMDZ4_AR5 n°1546 [[BR]] 
    135 '''En MPI pur''' (test sur 1 jour - compil avec le mode debug - adjust=n - ok_guide=false) : 
    136  * sur mercure 1P = 4P 
    137  * sur titane 24P = 32P 
    138 [[BR]][[BR]] 
    139  
    140 '''En MPI-Omp''' (test sur 1 mois - compil avec le mode debug - adjust=n - ok_guide=false): 
    141  * sur titane 32MPIx4OMP != 32MPIx1OMP  
    142  * sur titane 32MPIx1OMP = 32MPI pur 
    143  * ne compile pas sur mercure car physiq.F est trop gros et le compilateur annule l'openmp  
    144 [[BR]][[BR]] 
    14598 
    14699 
    147 === Tests LMDzOR sur titane === 
     100== Intégration dans les modèles ==  
     101=== LMDZOR === 
     102 Développements et tests 2010 - 2011 sur cette [wiki:IntegrationOpenMP/Dev2010_2011_LMDZOR page] 
    148103 
    149 Les fichiers de Bands établi avec le mécanisme de 3 mois standard dans la configuration LMDZ4OR_v3 varient (faiblement)  
    150 en fonction du nombre de processus MPI ET OpenMP. 
    151 En attachement, on trouvera des exemples de fichier de bands pour les tests décris dans le paragraphe précédent : 
    152  1. compilation avec OpenMP 
    153    1. 8MPI + 1OMP = 1 noeud et 8processeurs [attachment:"LOOMP_1_Bands_96x95x39_8MPI_1OMP.dat_3"] 
    154    1. 2MPI + 4OMP = 1 noeud et 8prc [attachment:"LOOMP4_Bands_96x95x39_2MPI_4OMP.dat_3"] 
    155    1. 8MPI + 4OMP   = 4 noeuds et 32prc [attachment:"LOOMP32_Bands_96x95x39_8MPI_4OMP.dat_3"] 
    156  1. compilation sans OpenMP 
    157    1. 8MPI + "0OMP" = 1 noeuds et 8prc [attachment:"LMPIOMP3_Bands_96x95x39_8MPI_1OMP.dat_3"] 
    158  
    159  
    160 Les tests effectuées avec le modèles LMDZ4/branches/LMDZ4_AR5 (rev 1483) et le modèle 
    161 LMDZ5/trunk (rev 1535), il s'avère que ce modèle, lorsque ORCHIDEE est désactivé à 
    162 l'éxécution (paramètre VEGET=n dans le run.def) ne conservent pas la parallélisation MPI/OpenMP. 
    163  
    164 Les simulations sans ORCHIDEE activé à l'éxécution avec le code LMDz version LMDZ4_AR5 : 
    165  1. LOOMPVEGET1 : ATM= (gcm.e, lmdz.x, 8MPI, 1OMP) 
    166  1. LOOMPVEGET2 : ATM= (gcm.e, lmdz.x, 2MPI, 4OMP) 
    167 Voir [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LOOMPVEGET2vsLOOMPVEGET1 LOOMPVEGET2vsLOOMPVEGET1] 
    168  
    169 Même version mais pas d'ajustement sur trois mois (on reprend la bande au bout des 
    170 trois mois des deux versions précédentes correspondantes pour les paramètres MPI/OpenMP) : 
    171  1. LOOMPVEGET3 (bande de LOOMPVEGET2) : ATM= (gcm.e, lmdz.x, 2MPI, 4OMP) 
    172  1. LOOMPVEGET4 (bande de LOOMPVEGET1) : ATM= (gcm.e, lmdz.x, 8MPI, 1OMP) 
    173 Voir [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LOOMPVEGET4vsLOOMPVEGET3 LOOMPVEGET4vsLOOMPVEGET3]. 
    174  
    175 Voir enfin 
    176 [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LOOMPVEGET4vsLOOMPVEGET3vsLOOMPVEGET2vsLOOMPVEGET1 LOOMPVEGET4vsLOOMPVEGET3vsLOOMPVEGET2vsLOOMPVEGET1] 
    177 qui montre bien que toutes ces simulations ne donnent pas les mêmes monitorings sur 
    178 un an. 
    179  
    180 Les simulations sans ORCHIDEE compilé à l'éxécution avec le code LMDz version LMDZ5 
    181  (avec ajustement sur trois mois) : 
    182  1. LMDZ5OMP : ATM= (gcm.e, lmdz.x, 8MPI, 1OMP) 
    183  1. LMDZ5OMP1 : ATM= (gcm.e, lmdz.x, 2MPI, 4OMP) 
    184 Voir 
    185  [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5OMP1vsLMDZ5OMP LMDZ5OMP1vsLMDZ5OMP] 
    186  qui montre que la nouvelle version de LMDz ne donne toujours pas les mêmes 
    187  monitorings sur un an. 
    188  
    189 Enfin les simulations sur 10 ans avec la dernière version de la végétation activée :  
    190  1. compilation avec OpenMP 
    191    1. 8MPI + 1OMP = 1 noeud et 8processeurs simulation LOOMP_1 
    192    1. 2MPI + 4OMP = 1 noeud et 8prc : simulation LOOMP4 
    193    1. 8MPI + 4OMP   = 4 noeuds et 32prc simulation LOOMP32 
    194  1. compilation sans OpenMP 
    195    1. 8MPI + "0OMP" = 1 noeuds et 8prc simulation LMPIOMP3 
    196  
    197 Les différences de monitorings suivant :  
    198 [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LOOMP4vsLOOMP_1 LOOMP4vsLOOMP_1] 
    199 [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LOOMP4vsLOOMP32 LOOMP4vsLOOMP32] 
    200 [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LOOMP4vsLMPIOMP3 LOOMP4vsLMPIOMP3] 
    201 et  
    202 [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LOOMP32vsLMPIOMP3 LOOMP32vsLMPIOMP3] 
    203 montrent que les modèles sont prochent avec les changement de compilation et de 
    204 parallélisation, mais que les précipitations notamment changent parfois beaucoup sur 
    205 la décénnie.    
    206  
    207 On ne peut donc pas conclure sur la robustesse de la parallélisation OpenMP du modèle 
    208 ORCHIDEE, tant que l'on a pas une version robuste du modèle LMDz.  
    209  
    210 ==== Correction LMDz 1557-1558 ==== 
    211 voir [http://lmdz.lmd.jussieu.fr/trac/changeset/1558 correction OpenMP LMDz exner_hyb_p.F]. 
    212  
    213 Plusieurs simulations ont élé lancées après avoir patché et recompiler les versions avec cette correction. 
    214  
    215 Deux simulations sans ORCHIDEE, resp. clones de LMDZ5OMP1 et LMDZ5OMP et compilé avec le même code patché par 1558 : 
    216  1. LMDZ5OMP2 : ATM= (gcm.e, lmdz.x, 2MPI, 4OMP) 
    217     Voir 
    218     [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5OMP2_vs_LMDZ5OMP1_vs_LMDZ5OMP/ LMDZ5OMP2vsLMDZ5OMP1vsLMDZ5OMP] 
    219     montre que le patch rapproche les simulations LMDZ5OMP et LMDZ5OMP2, mais sans obtenir le même résultat. 
    220  1. LMDZ5OMP3 : ATM= (gcm.e, lmdz.x, 8MPI, 1OMP) 
    221     Voir 
    222     [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5OMP3_vs_LMDZ5OMP/ LMDZ5OMP3vsLMDZ5OMP]. 
    223     LMDZ5OMP3 n'est pas identique à la précédente. La correction 1558 modifie donc le résultat.  
    224 Voir aussi la différence entre ces deux simulations : 
    225 [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5OMP3_vs_LMDZ5OMP2/ LMDZ5OMP3_vs_LMDZ5OMP2] 
    226 qui montre qu'elles se rapprochent bien avec la correction du bogue. 
    227  
    228 On se pose la question (il est temps !) de savoir si les redémarrages mettent en cause le défaut de reproduction de la parallélisation OpenMP. 
    229 On a donc lancé deux nouvelles simulations sur une année complète sans redémarrage : 
    230  1. LMDZ5OMP4 : idem LMDZ5OMP2 
    231  1. LMDZ5OMP5 : idem LMDZ5OMP3 
    232     Voir 
    233     [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5OMP5_vs_LMDZ5OMP3 LMDZ5OMP5vsLMDZ5OMP3] 
    234     LMDZ5OMP5 n'est pas identique à la précédente. Les redémarrages influencent les résultats.  
    235 On a pas désactivé les ajustements de la parallélisation dans ces deux simulations. 
    236  
    237 On obtient malheureusement toujours pas de précips correspondantes;  
    238 [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5OMP5_vs_LMDZ5OMP4 LMDZ5OMP5vsLMDZ5OMP4]. 
    239 Est-ce du à l'ajustement qui s'est prolongé toute l'année. Je passe à la correction de bogue suivante (E. Millour). 
    240  
    241 Avec la même version du source que LOOMPVEGET1, 2, 3 et 4, mais patché par 1558 : 
    242  1. LOOMPVEGET6, équivalent de LOOMPVEGET3 (bande de LOOMPVEGET2) : ATM= (gcm.e, lmdz.x, 2MPI, 4OMP) 
    243  1. LOOMPVEGET5, équivalent de LOOMPVEGET4 (bande de LOOMPVEGET1) : ATM= (gcm.e, lmdz.x, 8MPI, 1OMP) 
    244 Voir [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LOOMPVEGET6_vs_LOOMPVEGET5_vs_LOOMPVEGET4_vs_LOOMPVEGET3/ LOOMPVEGET6vsLOOMPVEGET5vsLOOMPVEGET4vsLOOMPVEGET3]. Pas de modification ?? J'abandonne l'utilisation de l'OpenMP dans la version LMDZ4_AR5 pour ces tests. En effet, beaucoup d'autres corrections on été faites sur la nouvelle version LMDZ5. 
    245  
    246 ==== Correction LMDz 1559 ==== 
    247 voir [http://lmdz.lmd.jussieu.fr/trac/changeset/1559 correction OpenMP LMDz exner_milieu_p.F]. 
    248  
    249 === Tests LMDZ4_AR5 avec correction 1559  (juillet) === 
    250 '''En MPI-Omp''' (test sur 1 mois - compil avec le mode debug - adjust=n - ok_guide=false): 
    251  * sur titane 32MPIx4OMP = 32MPIx1OMP  
    252 [[BR]][[BR]] 
    253  
    254 '''En mode nudgé''' moyennant quelques modifications dans le code on obtient bien l'égalité également 
    255  
    256 === Tests avec LMDZ5 après correction 1559 === 
    257 On a donc deux équilibrages de trois mois, puis utiliser leur bandes respectives pour démarrer  
    258 deux nouvelles simulations sur une année complète : 
    259  1. LMDZ5OMP6 : idem LMDZ5OMP4 
    260  1. LMDZ5OMP7 : idem LMDZ5OMP5 
    261 Le multi-monitoring de comparaison [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5OMP6_vs_LMDZ5OMP7 LMDZ5OMP6vsLMDZ5OMP7]  
    262 montre que les résultats se rapprochent beaucoup en PROD avec cette dernière correction. Mais ils ne sont toujours pas identiques pour les pluies notamment. 
    263 Rajouter ORCHIDEE ne pourra pas donner de résultat comparatifs. 
    264  
    265 ==== Test en mode dev sur titane ==== 
    266  
    267 Utilisation de  
    268  * la révision 1573 pour LMDz avec cette modif : 
    269 {{{ 
    270 =================================================================== 
    271 --- arch/arch-X64_TITANE.fcm    (revision 1573) 
    272 +++ arch/arch-X64_TITANE.fcm    (working copy) 
    273 @@ -6,7 +6,7 @@ 
    274  %FPP_DEF             NC_DOUBLE BLAS SGEMV=DGEMV SGEMM=DGEMM FFT_MKL 
    275  %BASE_FFLAGS         -i4 -r8 -automatic -align all -I${MKLROOT}/include 
    276  %PROD_FFLAGS         -O3 
    277 -%DEV_FFLAGS          -p -g -O3 -traceback -fp-stack-check -ftrapuv 
    278 +%DEV_FFLAGS          -p -g -O3 -traceback -fpe0 -fp-stack-check -ftrapuv 
    279  %DEBUG_FFLAGS        -p -g -traceback 
    280  %MPI_FFLAGS 
    281  %OMP_FFLAGS          -openmp 
    282 }}} 
    283    (mais sans les modifs de code de Arnaud pas commitées, [[BR]]voir : /work/cont003/p86manci/LMDZ5DEB_OMP/modeles/LMDZ/libf/radiation_AR4_01.F), 
    284  * et 476 de branches/OpenMP pour ORCHIDEE. 
    285  
    286 La compilation est en mode dev pour LMDz et normale pour ORCHIDEE. 
    287 Les deux configurations précédentes sont reprises ici : /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4.[[BR]] 
    288 Le multi-monitoring de comparaison est là : [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5dOMP1-LMDZ5dOMP2 LMDZ5dOMP1-LMDZ5dOMP2]. 
    289 Toujours pas de correspondance.  
    290  
    291 Je lance deux tous derniers tests avec ce source LMDz, mais sans ORCHIDEE. 
    292 Ces deux simulations en mode donnent le multi-monitoring [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5d1-2_prod/index.html suivant] et ne correspondent 
    293 toujours pas. Les simulations LMDz, même en mode dev, ne donnent pas le même résultat sur titane pour l'instant.  
    294  
    295 Suite à la présentation des tests de Joséfine sur vargas (et un peu titane) : cf [http://lmdz.lmd.jussieu.fr/utilisateurs/distribution-du-modele/versions-intermediaires/lmdz5-trunk-revision-1575 rev-1575],  
    296 il s'avère que le choix de test (4 MPI, 2 OMP) versus (8 MPI, 1 OMP) comporte probablement une erreur due au 1 OMP du deuxième test. [[BR]] 
    297  
    298 J'ai donc relancé des tests avec et sans ORCHIDEE en (2 MPI, 4 OMP) pour vérifier la reproductibilité. Le couple de tests à comparer sera alors  
    299  1. LMDZ5d2 : ATM= (gcm.e, lmdz.x, 2MPI, 4OMP) 
    300  1. LMDZ5d3 : ATM= (gcm.e, lmdz.x, 4MPI, 2OMP) 
    301 Le multi-monitoring [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5d2_LMDZ5d3_prod/ LMDZ5d2-3] montre que même si on a bien un correspondance au début de l'année, 
    302 on N'A PAS de correspondance en mode DEV sur un an. 
    303   
    304 Et  
    305  1. LMDZ5dOMP2 : ATM= (gcm.e, lmdz.x, 2MPI, 4OMP) + SRF 
    306  1. LMDZ5dOMP3 : ATM= (gcm.e, lmdz.x, 4MPI, 2OMP) + SRF 
    307 Le multi-monitoring [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5dOMP2-3_prod/ LMDZ5dOMP2-3] montre que même si on a bien un correspondance au début de l'année, 
    308 on N'A PAS de correspondance en mode DEV sur un an. On voit que la réponse de surface est tout de même très similaire. Mais on ne peut pas conclure sur la parallélisation OpenMP de ORCHIDEE.[[BR]] 
    309     
    310 De même en diminuant l'optimisation à la compilation de LMDz5 ( -O2 à la place de -O3 ), on n'obtient toujours pas une égalité : [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5d2-O2_LMDZ5d3-O2_prod/ LMDZ5d2-O2_LMDZ5d3-O2]. 
    311  
    312 '''Par contre''' avec l'optimisation minimale à la compilation de LMDZ5; '''-O1''' on obtient bien une égalité parfaite des deux simulations. 
    313 [http://dods.ipsl.jussieu.fr/orchidee/Parallelization_OpenMP/LMDZ5d2-O1_LMDZ5d3-O1_prod/ LMDZ5d2-O1_LMDZ5d3-O1]. Il semble donc bien qu'une  
    314 simulation avec ORCHIDEE puisse être validée avec LMDz compilé avec ce niveau d'optimisation. 
    315  
    316 On construit donc deux nouvelles simulations avec LMDz compilé avec -O1 et ORCHIDEE et IOIPSL compilés avec -O3 : 
    317  1. LMDZ5dOMP2-O1 : ATM= (gcm.e, lmdz.x, 8MPI, 4OMP) + SRF 
    318  1. LMDZ5dOMP3-O1 : ATM= (gcm.e, lmdz.x, 4MPI, 8OMP) + SRF 
    319  
    320 === Nouveau Tests LMDZOR avec correction 1559 (12/11 - 02/12) === 
    321  
    322 ==== LMDz et ORCHIDEE compilés en -O1 ==== 
    323  
    324 Avec une compilation en optimisation -O1 (identique à la précédente LMDZ5dOMP2 et 3), 
    325 le modèle LMDZ5dOMP plante en cours d'année (erreur assert) 
    326  * LMDZ5dOMP2-O1-O1 (10/12/11) - 8MPI, 4OMP : [[BR]] 
    327    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP2-O1-O1 
    328    * /dmnfs/cont003/p86manci/IGCM_OUT/LMDZOR/TEST/CLIM/LMDZ5dOMP2-O1-O1/ 
    329  * LMDZ5dOMP3-O1-O1 (12/12/11) - 4MPI, 8OMP : [[BR]] 
    330    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP3-O1-O1 
    331    * /dmnfs/cont003/p86manci/IGCM_OUT/LMDZOR/TEST/CLIM/LMDZ5dOMP3-O1-O1/ 
    332 Je ne comprends pas ce résultat car LMDz tourne sans problème sans ORCHIDEE !  
    333 cf courriel ESCI le 09/01/2012 intitulé "erreur LMDZOROMP sur titane : appel à idée 
    334 ..." 
    335  
    336 ==== LMDz compilé en -O0 et ORCHIDEE compilé en -O1 ==== 
    337  
    338 Avec LMDz compilé en DEBUG, on obtient une simulation de un mois ('''mais pas un an''') : 
    339  * LMDZ5dOMP2-O0-O1(-1M) (09/01/11) - 8MPI, 4OMP : [[BR]] 
    340    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP2-O0-O1-1M 
    341    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP2-O0-O1 
    342    * /dmnfs/cont003/p86manci/IGCM_OUT/LMDZOR/TEST/CLIM/LMDZ5dOMP2-O0-O1/ 
    343  * LMDZ5dOMP3-O0-O1(-1M) (09/01/11) - 4MPI, 8OMP : [[BR]] 
    344    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP3-O0-O1-1M 
    345    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP3-O0-O1 
    346    * /dmnfs/cont003/p86manci/IGCM_OUT/LMDZOR/TEST/CLIM/LMDZ5dOMP3-O0-O1/ 
    347 Les différences de restart  
    348 {{{ 
    349 cd /scratch/cont003/p86manci 
    350 cdo diffv LMDZ5dOMP2-O0-O1-1M_19800130_sechiba_rest.nc LMDZ5dOMP3-O0-O1-1M_19800130_sechiba_rest.nc 
    351 cdo diffv LMDZ5dOMP2-O0-O1-1M_19800130_restart.nc LMDZ5dOMP3-O0-O1-1M_19800130_restart.nc 
    352 }}} 
    353 pour ORCHIDEE et LMDz donnent des erreurs importantes. 
    354  
    355 ==== LMDz et ORCHIDEE compilés en -O0 ==== 
    356  
    357 Le modèle a alors été compilé en mode DEBUG total (-O0 pour les deux modèles). 
    358  
    359 Les simulations sur un an dans ce mode de compilation sont : 
    360  * LMDZ5dOMP2-O0-O0 (09/01/12) - 8MPI, 4OMP : [[BR]] 
    361    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP2-O0-O0 
    362    * /dmnfs/cont003/p86manci/IGCM_OUT/LMDZOR/TEST/CLIM/LMDZ5dOMP2-O0-O0/ 
    363  * LMDZ5dOMP3-O0-O0 (09/01/12) - 4MPI, 8OMP : [[BR]] 
    364    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP3-O0-O0 
    365    * /dmnfs/cont003/p86manci/IGCM_OUT/LMDZOR/TEST/CLIM/LMDZ5dOMP3-O0-O0/ 
    366 La simulation LMDZ5dOMP2-O0-O0 a tourné sur un an, mais pas la simulation 
    367 LMDZ5dOMP3-O0-O0. 
    368  
    369 J'ai donc refait des simulations sur des temps plus court (un seul jour), 
    370 mais avec des sorties HF dans LMDz (en mettant :  
    371 {{{ 
    372      LMDZ_ecrit_mth=.02083333333333333333 
    373 [...] 
    374      LMDZ_sed physiq.def phys_out_filekeys "y n n n n" 
    375 ! #"${OK_mensuel} ${OK_journe} ${ok_hf} ${OK_instan} ${OK_les}" 
    376 }}} 
    377 dans lmdz.driver et sans ajustement (en rajoutant  
    378 {{{ 
    379             if ( [ X${LMDZ_Bands_file_name} != X ] && [ -f ${LMDZ_Bands_file_name} ] ) ; then 
    380                 IGCM_sys_Get ${LMDZ_Bands_file_name} Bands_${RESOL_ATM_3D}_${ATM_PROC_MPI}prc.dat ; IGCM_sys_Chmod u+w Bands_${RESOL_ATM_3D}_${ATM_PROC_MPI}prc.dat 
    381 }}} 
    382 dans le même fichier. 
    383  
    384 Avec l'ajustement, sur un jour on obtient des différences dans la dynamique de 
    385 l'atmosphères qui se répercutent dans ORCHIDEE au début du troisième pas de temps (du 
    386 fait du pas de temps d'une heure pour le schéma radiatif). 
    387  
    388 Pour une simulation de un jour, sans routage et sans ajustement : 
    389  * LMDZ5dOMP2-O0-O0-1D-R1-2 (04/02/2012) 
    390  * LMDZ5dOMP3-O0-O0-1D-R1-2 (04/02/2012) 
    391 On a plus ces différences. 
    392  
    393 J'ai donc relancer les deux simulations annuelles, sans ajustement : 
    394  * LMDZ5dOMP2-O0-O0-1 (04/02/12) - 8MPI, 4OMP : [[BR]] 
    395    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP2-O0-O0-1 
    396    * /scratch/cont003/p86manci/RUN_DIR/747611/LMDZOR/LMDZ5dOMP2-O0-O0-1.18624 
    397    * /dmnfs/cont003/p86manci/IGCM_OUT/LMDZOR/TEST/CLIM/LMDZ5dOMP2-O0-O0-1/ 
    398  * LMDZ5dOMP3-O0-O0-1 (04/02/12) - 4MPI, 8OMP : [[BR]] 
    399    * /work/cont003/p86manci/LMDZ5DEB_OMP/config/LMDZOR_v4/LMDZ5dOMP3-O0-O0-1 
    400    * /scratch/cont003/p86manci/RUN_DIR/747610/LMDZOR/LMDZ5dOMP3-O0-O0-1.13026 
    401    * /dmnfs/cont003/p86manci/IGCM_OUT/LMDZOR/TEST/CLIM/LMDZ5dOMP3-O0-O0-1/ 
    402 Toujours sans succès (la simulation plante avant un an)... 
    403  
    404 Voir la fin de 
    405 /scratch/cont003/p86manci/RUN_DIR/747611/LMDZOR/LMDZ5dOMP2-O0-O0-1.18624/out_lmdz.x.out.0001 
    406 ou 
    407 /scratch/cont003/p86manci/RUN_DIR/747610/LMDZOR/LMDZ5dOMP3-O0-O0-1.13026/out_lmdz.x.out.0001 : 
    408 {{{ 
    409  nrerror: an assertion failed with this tag:regr_pr_av paprs 
    410  program terminated by assert_v 
    411 }}} 
    412  
    413 === Tests IPSLCM5A sur titane === 
    414  
    415 La configuration couplée IPSLCM5A utilisée est la configuration standard avec les modifications suivantes : 
    416  
    417 ORCHIDEE : http://forge.ipsl.jussieu.fr/orchidee/svn/branches/OpenMP/ORCHIDEE 
    418  
    419 LMDZ : modification dans oasis.F90 
    420 {{{ 
    421 -    LOGICAL                            :: cpl_current_omp 
    422 +    LOGICAL, SAVE                            :: cpl_current_omp 
    423 }}} 
    424 libIGCM : libIGCM prise chez Martial (en attente de commit sur une branche après le prochain tag) 
    425  
    426 IPSLCM5A : modifications à la main dans config.card, oasis.card 
    427  
    428 Tests en cours (a comparer avec piControl2) : 
    429 - 10 ans : 5 OCE MPI, 26 ATM MPI (x 1 OMP) 
    430 - 10 ans : 5 OCE MPI, 12 ATM MPI x 4 OMP 
    431  
    432  
    433 === Point le 28/7/2011 === 
    434  
    435 Voir commit de Yann sur LMDZ là : http://lmdz.lmd.jussieu.fr/trac/changeset/1558 
    436  
    437 Tests avec la modif ci-dessus :  
    438  * Titane : Résultats identiques (comparaisons restarts) sur une simu de 25 jours de LMDZ seul (sans aer, sans ORCHIDEE) avec LMDR4_AR5 compilé en mode debug entre : 
    439   * 32 process MPI, 1 thread OpenMP 
    440   * 32 process MPI, 4 threads OpenMP 
    441  
    442 Prochaines étapes :  
    443  * tests avec activation aerosols, activation Orchidee, activation couplage ocean 
    444  * adaptation libIGCM pour vargas 
    445104 
    446105== TESTS ANNE SEPTEMBRE 2012 ==