| 1 | == Vendredi 16 avril 2021 == |
| 2 | |
| 3 | presents : Christian, Laurent, Arnaud, Juliette, Julie |
| 4 | |
| 5 | MR1 |
| 6 | intermonitoring https://vesg.ipsl.upmc.fr/thredds/fileServer/IPSLFS/fabric/QUEST/QUEST_InterMonit_DECK/index.html |
| 7 | inclus 2 piCtrl de MR1, qui demarrent du meme etat initial, 6.2 avant maintenance (rouge) et 6.2.2 (bleue) apres maintenant et toujours en cours |
| 8 | besoin d'appliquer addnoise sur 6.2.2 car ne voulait pas demarrer -> partie sur une autre trajectoire |
| 9 | Laurent a recompilé apres la maintenance. |
| 10 | Simulations bcp + lentes à partir 1870 car workflow CMIP6 (15-20%)-> CM6.2 timelimit (1883)-> pb relecture fichiers. -> Redemarrage 1870 |
| 11 | CM6.2.2 a du être reprise de 1850 car pb workflow. |
| 12 | Garde t on les 2? a priori oui pour verifier que modele decrit la meme stat apres 30-40 années. |
| 13 | MR1 avec workflow= 8-9 ans/jr apres 1870. -> 60 jrs. |
| 14 | |
| 15 | MR025: depuis la maintenance, le job corromp les fichiers quand il essaie de les ouvrir. Pb librairie suite à maintenance -> recompiler? Ou lié à diminutions perfs à partir 1870? pour l'instant bloque le job completement, en janvier 1974, et ne parvient pas à poursuivre du tout |
| 16 | |
| 17 | Pb actuel: plantage (par instabilités machine (semble etre le cas MR1)? ou par pb XIOS qui ne tient pas "la charge" (semble etre le cas MR025)?) nous fait courir le risque de devoir recommencer une simu depuis le début (si fichier netcdf corrompu lors de la fermeture ou de la re-ouverture, par exemple). solutions possibles ? |
| 18 | A: faire sauvegarde des netcdf CMIP6 à intervalles pre-determinés pour pouvoir ne pas avoir à recommencer du début . mais prend temps de sauvegarde considerable + augmente risque de corrompre les fichiers netcdfs au moment de la manipulation |
| 19 | B: reduire la taille des chunks pour sauvegarder fichiers plus petits. cela doit etre une option de dr2xml. dans ce cas pas besoin de backups des CMIP6. mais necessite que Arnaud regenere des xmls... |
| 20 | |
| 21 | MR025 piCtrl-spinup: |
| 22 | spin-up analytique ORCHIDEE toujours en cours (spinup-02 en orange sur l'intermonitoring ci dessu) |
| 23 | |
| 24 | en parallele, Christian a reussi à bidouiller des restarts MR025 à partir de restarts MR1 ORCHIDEE (rose) - a tourné 24 ans (conditions piCtrl) sans pb, puis pb de fichiers netcdf décrits ci dessus |
| 25 | |
| 26 | on conserve MR025-pi-01 pour poursuivre les tests de faisabilite de DECK MR025 et on conserve aussi MR025-pi-spinup-02 qui a priori fournira un meilleur etat initial pour le piCtrl final |
| 27 | |
| 28 | note : ce matin MR025-pi-spinup-02 a planté pour cause de pb SSH (en septembre, en Arctic), redemarrage en Euler ne suffit pas à depasser plantage, Christian relance avec pas de temps diminué pour voir... |
| 29 | |
| 30 | |
| 31 | Demande d'allocation supplementaire sur Irene ROME ? sur Irene SKL ? |
| 32 | a priori on ne deplace pas de simulation en cours de ROME vers SKL |
| 33 | |
| 34 | mais SKL beaucoup plus stable que ROME, donc on pourrait commencer MR025-piCtrl ou 1%CO2 ou +4CO2 sur SKL. mais tests workflow non realises sur SKL donc demande un peu de travail supplementaire |
| 35 | |
| 36 | Julie reprend estimation des couts des simulations DECK (hors AMIP) en incluant surcout post1870 |
| 37 | pour envisager changement de machine pour certaines simulations |
| 38 | -> partage avec Gerhard Krinner et Olivier Boucher pour avoir leur avis sur la meilleur repartition entre machines |
| 39 | MR025 avec workflow piCtrl post 1870 : 12000s par an simulé au lieu de 9000s (+25%) |
| 40 | |
| 41 | |
| 42 | |
| 43 | |
| 44 | |