Changes between Version 91 and Version 92 of IPSLCM6/ReunionsQuest


Ignore:
Timestamp:
04/22/21 14:31:19 (3 years ago)
Author:
jdlod
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • IPSLCM6/ReunionsQuest

    v91 v92  
     1== Vendredi 16 avril 2021 == 
     2 
     3presents : Christian, Laurent, Arnaud, Juliette, Julie 
     4 
     5MR1 
     6        intermonitoring  https://vesg.ipsl.upmc.fr/thredds/fileServer/IPSLFS/fabric/QUEST/QUEST_InterMonit_DECK/index.html 
     7                inclus 2 piCtrl de MR1, qui demarrent du meme etat initial, 6.2 avant maintenance (rouge) et 6.2.2 (bleue) apres maintenant et toujours en cours 
     8                besoin d'appliquer addnoise sur 6.2.2 car ne voulait pas demarrer -> partie sur une autre trajectoire 
     9                Laurent a recompilé apres la maintenance.  
     10                Simulations bcp + lentes à partir 1870 car workflow CMIP6 (15-20%)-> CM6.2 timelimit (1883)-> pb relecture fichiers. -> Redemarrage 1870 
     11                CM6.2.2 a du être reprise de 1850 car pb workflow.  
     12                Garde t on les 2? a priori oui pour verifier que modele decrit la meme stat apres 30-40 années.  
     13                MR1 avec workflow= 8-9 ans/jr apres 1870. -> 60 jrs.  
     14                 
     15MR025: depuis la maintenance, le job corromp les fichiers quand il essaie de les ouvrir. Pb librairie suite à maintenance -> recompiler? Ou lié à diminutions perfs à partir 1870? pour l'instant bloque le job completement, en janvier 1974, et ne parvient pas à poursuivre du tout 
     16         
     17                Pb actuel: plantage (par instabilités machine (semble etre le cas MR1)? ou par pb XIOS qui ne tient pas "la charge" (semble etre le cas MR025)?) nous fait courir le risque de devoir recommencer une simu depuis le début (si fichier netcdf corrompu lors de la fermeture ou de la re-ouverture, par exemple). solutions possibles ? 
     18                        A: faire sauvegarde des netcdf CMIP6 à intervalles pre-determinés pour pouvoir ne pas avoir à recommencer du début . mais prend temps de sauvegarde considerable + augmente risque de corrompre les fichiers netcdfs au moment de la manipulation 
     19                        B: reduire la taille des chunks pour sauvegarder fichiers plus petits. cela doit etre une option de dr2xml. dans ce cas pas besoin de backups des CMIP6. mais necessite que Arnaud regenere des xmls... 
     20                 
     21MR025 piCtrl-spinup: 
     22                spin-up analytique ORCHIDEE toujours en cours (spinup-02 en orange sur l'intermonitoring ci dessu) 
     23                 
     24                en parallele, Christian a reussi à bidouiller des restarts MR025 à partir de restarts MR1 ORCHIDEE (rose) - a tourné 24 ans (conditions piCtrl) sans pb, puis pb de fichiers netcdf décrits ci dessus 
     25         
     26                on conserve MR025-pi-01 pour poursuivre les tests de faisabilite de DECK MR025 et on conserve aussi MR025-pi-spinup-02 qui a priori fournira un meilleur etat initial pour le piCtrl final 
     27                 
     28                note : ce matin MR025-pi-spinup-02 a planté pour cause de pb SSH (en septembre, en Arctic), redemarrage en Euler ne suffit pas à depasser plantage, Christian relance avec pas de temps diminué pour voir... 
     29 
     30 
     31Demande d'allocation supplementaire sur Irene ROME ? sur Irene SKL ?  
     32                a priori on ne deplace pas de simulation en cours de ROME vers SKL 
     33                 
     34                mais SKL beaucoup plus stable que ROME, donc on pourrait commencer MR025-piCtrl ou 1%CO2 ou +4CO2 sur SKL. mais tests workflow non realises sur SKL donc demande un peu de travail supplementaire 
     35 
     36                Julie reprend estimation des couts des simulations DECK (hors AMIP) en incluant surcout post1870 
     37                pour envisager changement de machine pour certaines simulations  
     38                -> partage avec Gerhard Krinner et Olivier Boucher pour avoir leur avis sur la meilleur repartition entre machines 
     39                MR025 avec workflow piCtrl post 1870 : 12000s par an simulé au lieu de 9000s (+25%) 
     40 
     41 
     42 
     43 
     44 
    145== Vendredi 2 avril 2021 == 
    246 
    3 CR reunion QUEST 2 avril 2021 
    447 
    548presents : Christian, Laurent, Arnaud, Juliette, Brady, Nicolas, Julie