Changes between Version 30 and Version 31 of Modipsl_exec


Ignore:
Timestamp:
09/23/11 11:18:56 (13 years ago)
Author:
acosce
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • Modipsl_exec

    v30 v31  
    229229[[BR]][[BR]] 
    230230 
    231 ---- 
    232  
    233 = __FAQ Exécution__ =  
    234  
    235 == Le parallelisme et les fichiers Bands == 
    236 Dans LMDZ si le nombre de points par tâche MPI est distribué de façon uniforme, l'équilibrage de charge n'est pas optimum. Il existe une option '''adjust''' (dans lmdz.card) qui permet d'indiquer au code que l'on veut qu'il "ajuste" sa répartition des points. Pour cela lors d'un run on mesure le temps passé dans chaque partie du code et on définit la répartition optimum. Cette nouvelle répartition est stockée alors dans le fichier Bands_res_nbProc.dat (dépend de la configuration – de la machine – de la résolution – du nombre de proc). [[BR]] 
    237 Idéalement il faut faire une pré-simulation permettant de créer ce fichier (~ 3 mois de simulation). Puis ensuite utiliser ce fichier pour la simulation "maître". Le fichier est stocké dans le répertoire $DMFDIR/IGCM_OUT/nom_config/.../nom_simul/ATM/Debug/[[BR]] 
    238 Voir [https://forge.ipsl.jussieu.fr/igcmg/wiki/Modipsl_exec#Optionsdanslmdz.card ici] pour l'utilisation de adjust et du fichier Bands.  
    239  
    240 '''A retenir pour IPSLCM5A ''' : Par défaut, le couplé IPSLCM5A, peut tourner sur un nombre quelconque de processeurs. Il crée lui-même le fichier Bands lors des 3 premiers mois de la simulation puis utilise celui du dernier mois. Il est possible d'utiliser le fichier Bands d'une autre simulation, voir paramétrage dans COMP/lmdz.card. 
    241  
    242 '''ATTENTION''' : Pour être certain d'obtenir les même résultats entre deux simulations il faut annuler l'ajustement et la création des fichiers Bands. Il faut utiliser pour les deux simulations le MÊME fichier Bands.  
    243  
    244  
    245 [[BR]][[BR]] 
    246 == Comment décrypter le fichier Script_Output == 
    247 A la fin de chaque période de simulation un fichier Script_Output correspondant est créé. Ces fichiers comportent trois parties :  
    248  * copies des fichiers d'input 
    249  * exécution  
    250  * copies des fichiers d'output 
    251 Ces trois parties sont délimités ainsi :  
    252 {{{ 
    253 ####################################### 
    254 #       ANOTHER GREAT SIMULATION      # 
    255 ####################################### 
    256  
    257  1ère partie 
    258  
    259 ####################################### 
    260 #      DIR BEFORE RUN EXECUTION       # 
    261 ####################################### 
    262  
    263  2ème partie 
    264  
    265 ####################################### 
    266 #       DIR AFTER RUN EXECUTION       # 
    267 ####################################### 
    268  
    269  3ème partie 
    270  
    271 }}} 
    272 Si à la fin de votre simulation le fichier [https://forge.ipsl.jussieu.fr/igcmg/wiki/Modipsl_exec#Findesimulation run.card] indique qu'il y a eu un problème vous devez analyser votre fichier Script_Output.  
    273 Il y a plusieurs solutions :  
    274  * si le fichier s'arrête avant le début de la deuxième partie c'est que soit vous n'avez pas effacé un fichier run.card existant, soit l'un des fichiers d'input que vous demandez n'existe pas.  
    275  * si le fichier s'arrête durant la deuxième partie c'est certainement que vous n'avez pas demandé assez de mémoire ou de temps CPU 
    276  * si le fichier est entier c'est soit qu'il y a une erreur lors de l'exécution, soit qu'il y a un problème lors de la copie des outputs.  
    277 Si le message suivant apparaît dans la deuxième partie du fichier, c'est qu'il y a un problème lors de l'exécution. 
    278 {{{ 
    279 ======================================================================== 
    280 EXECUTION of : mpirun -f ./run_file > out_run_file 2>&1 
    281 Return code of executable : 1 
    282 IGCM_debug_Exit :  EXECUTABLE 
    283  
    284 !!!!!!!!!!!!!!!!!!!!!!!!!! 
    285 !! IGCM_debug_CallStack !! 
    286 !------------------------! 
    287  
    288 !------------------------! 
    289 IGCM_sys_Cp : out_run_file xxxxxxxxxxxx_out_run_file_error 
    290 ======================================================================== 
    291 }}} 
    292 Si au contraire vous avez le message suivant 
    293 {{{ 
    294 ======================================================================== 
    295 EXECUTION of : mpirun -f ./run_file > out_run_file 2>&1 
    296 ======================================================================== 
    297 }}} 
    298 Il y a alors deux solutions : 
    299  * dans 90% des cas  c'est que le problème s'est produit lors de la copie des outputs.  
    300  * dans les 10% restant c'est que vous êtes passé par un garde fou du modèle et que celui-ci s'est fini proprement mais avant  
    301 la fin de la simulation. Dans ce cas là si votre modèle propose un journal de sortie autre que celui de la simulation il faut le consulter.  
    302 Par exemple, le fichier de sortie de l'océan est stocké sur le serveur de fichiers sous ce nom là : 
    303 {{{ 
    304 IGCM_sys_Put_Out : ocean.output xxxxxxxx/OCE/Debug/xxxxxxxx_ocean.output 
    305 }}} 
    306 Sinon (par exemple pour LMDZ ou INCA) votre journal de sortie est confondu avec celui de la simulation et celui-ci n'a pas eu le temps d'être 
    307 copié sur l'espace de stockage (explication [wiki:ModipslBeginner#Commentsontstockéslesfichiersdesortiesdumodèle ICI]). Si votre simulation a tourné  
    308 sur le $SCRATCHDIR vous pouvez le récupérer là, sinon vous devez relancer votre simulation sur le $SCRATCHDIR  
    309 (par défaut elle est sur le $TMPDIR). Pour cette opération il faut modifier la variable RUN_DIR_PATH voir [wiki:ModipslBeginner#Créationdujob ICI].  
    310  
    311  
    312 [[BR]][[BR]] 
    313  == Écraser une simulation == 
    314  1. Vous devez effacer dans votre répertoire d'expérience les fichiers stack_error (si existant) et run.card.  
    315  2. Vous devez effacer le répertoire $DMFDIR/IGCM_OUT/_config_/(...)/_nom_simul_ 
    316  3. Si vous aviez changé la variable RUN_DIR_PATH vous devez également effacer le répertoire correspondant à votre simulation sur votre scratchdir.  
    317  4. Relancer le job 
    318  
    319  
    320 [[BR]][[BR]] 
    321 == Continuer une simulation == 
    322  1. Dans le fichier config.card modifiez la date de fin de simulation 
    323  2. Dans le fichier run.card vous devez :  
    324   * vérifier que les variables !PeriodDateBegin et !PeriodDateEnd correspondent bien à votre prochaine période de simulation (ex: si vous venez de finir le mois de mai 2000 vous devez avoir !PeriodDateBegin= 20000601 et !PeriodDateEnd= 2000630)  
    325   * indiquer !PeriodState = !OnQueue 
    326  3. Dans le Job vous devez modifier le numéro du fichier de sortie pour qu'il ne se plante pas en cherchant à remplacer un fichier Script_Output existant. Par défaut c'est Script_Output_NomJob.0001, vous pouvez le changer par Script_Output_NomJob.!CumulPeriod (vous trouverez !CumulPeriod dans run.card)  
    327  4. Si jamais vous êtes dans le cas ou votre simulation s'est arrêtée au milieu d'un mois et vous la relancez, il faut effacer les fichiers créés pour ce mois là dans vos archives ($DMFDIR/IGCM_OUT/etc...). Vous pouvez utiliser le script modipsl/libIGCM/clean_month.job pour cela. Mode d'emploi : 
    328  {{{ 
    329  cd $SUBMIT_DIR (ie modipsl/config/IPSLCM5A/EXP00) 
    330  cp ../../../libIGCM/clean_month.job . ; chmod 755 clean_month.job  # une seule fois pour toute 
    331  ./clean_month.job   #   Repondre aux questions.  
    332 qsub Job_EXP00 
    333 }}} 
    334  
    335  
    336 [[BR]][[BR]] 
    337 == Comment préparer une nouvelle expérience ? == 
    338 Pour cela il suffit de recopier le répertoire EXP00, dans son ensemble, dans un autre répertoire.[[BR]] 
    339 Par commodité on appellera ce répertoire du même nom que l'expérience (!JobName dans config.card). 
    340 {{{ 
    341 cd modipsl/config/IPSLCM5A 
    342 cp -pr EXP00 MONEXP 
    343 cd MONEXP 
    344 rm -f run.card Sc* Jo* # nécessaire si une simu a déjà tourné dans le répertoire EXP00 
    345 vi config.card # Changer ce qu'on veut et en particulier JobName 
    346 ../../util/ins_job # installera un nouveau Job_MONEXP et dira qu'il ne peut pas réinstaller les jobs de post-traitements qui existent déjà. Pas grave. 
    347 }}} 
    348  
    349 ATTENTION : si vous modifiez vos codes et recompilez durant une simulation c'est ce nouvel exécutable qui sera pris en compte pour la fin de la simulation  
    350  
    351  
    352 [[BR]][[BR]] 
    353 == Démarrer depuis une autre simulation  == 
    354 Dans le fichier config.card vous devez préciser les différents paramètres de la section Restarts : 
    355 {{{ 
    356 #======================================================================== 
    357 #D-- Restarts - 
    358 [Restarts] 
    359 #D- If you want a GENERAL RULE FOR ALL COMPONENTS RESTARTS, put this flag to 'y' 
    360 OverRule=y 
    361 #D- Last day of the experience used as restart 
    362 RestartDate=1869-12-30 
    363 #D- Define restart simulation name 
    364 RestartJobName=CD1 
    365 #D- Path Server Group Login 
    366 RestartPath=${ARCHIVE}/IGCM_OUT/IPSLCM5A/DEVT/pdControl 
    367 }}} 
    368 [[BR]] 
    369 Si la simulation a été faite par une autre personne, vous devez bien préciser le répertoire : 
    370 {{{ 
    371 RestartPath=/u/rech/lab/plabxxx/IGCM_OUT/IPSLCM5A/DEVT/pdControl # ou /dmnfs/contxxx/login/IGCM_OUT/IPSLCM5A/DEVT/pdControl 
    372 }}} 
    373 [[BR]] 
    374 Pour avoir exactement les mêmes résultats, il faut prendre le même fichier Bands. Cela se précise dans COMP/lmdz.card avec les paramètres LMDZ_NbPeriod_adjust et LMDZ_Bands_file_name ainsi : 
    375 {{{ 
    376 LMDZ_NbPeriod_adjust=0 
    377 # To force usage of this Bands file, put LMDZ_NbPeriod_adjust=0 and replace XXXXXXX by Restart Job Name 
    378 LMDZ_Bands_file_name=${ARCHIVE}/IGCM_OUT/IPSLCM5/CEPRO0/ATM/Debug/CEPRO0_Bands_96x95x39_3prc.dat_3 
    379 }}} 
    380 '''A noter''' : vous pouvez séparer les paramètres de redémarrage par composantes. Laisser !OverRule=n et utiliser alors les différents paramètres Restart, !RestartDate, !RestartJobName et !RestartPath pour chaque composante (section). Par exemple pour l'atmosphère : 
    381 {{{ 
    382 #D-- ATM - 
    383 [ATM] 
    384 # 
    385 WriteFrequency="1M 1D HF" 
    386 # If config_Restarts_OverRule == 'n' all params are read 
    387 Restart= y 
    388 # Last day of the experience used as restart for this component 
    389 RestartDate=1999-12-30 
    390 # Define restart simulation name 
    391 RestartJobName=2L18 
    392 RestartPath=${ARCHIVE}/IGCM_OUT/IPSLCM5A/DEVT/pdControl 
    393 }}} 
    394  
    395  
    396 [[BR]][[BR]] 
    397 == Comment repérer qu'il manque un fichier dans les sorties, ou que l'un des fichiers est incomplet ? == 
    398 Depuis le 19 janvier 2011, le script check_expe_files_size.sh disponible dans le répertoire libIGCM/libIGCM_post ou là : [http://forge.ipsl.jussieu.fr/libigcm/browser/trunk/libIGCM/libIGCM_post/check_expe_files_size.sh  check_expe_files_size.sh] permet de repérer les trous dans des séries de fichiers rangés selon la nomenclature IPSL. 
    399  
    400  Options :  
    401  * L'option -Z permet d'étudier les tailles des fichiers et de repérer si les tailles des mois de janvier (février, ...) sont différentes entre les années. Fonctionne aussi avec les années bissextiles. Attention au temps d'execution qui dépasse largement 10 mn dans ce cas. 
    402  * L'option -I xxxx, permet d'arrêter la vérification des noms à cette année là. Utile dans le cas d'une simulation en route avec des rebuild non faits. 
    403  * L'option -R permet de parcourir l'arborescence. 
    404  
    405  Machines testées : CCRT (répertoire $DMFDIR) et IDRIS (gaya directement) 
    406  
    407 Exemples d'utilisation : 
    408 {{{ 
    409 check_expe_files_size.sh SRF/Output/MO # verification des noms du repertoire SRF/Output/MO 
    410 check_expe_files_size.sh -Z SRF/Output/MO # verification des noms et des tailles des fichiers du repertoire 
    411 check_expe_files_size.sh -R -S "*/Output" # verification des noms des fichiers pour toute une simulation IPSL 
    412 check_expe_files_size.sh -Z -R -S "*/Output" # verification des noms et des tailles des fichiers pour toute une simulation IPSL 
    413 check_expe_files_size.sh -I 1949 -R -S "*/Output" # verification jusuque a l annee 1949 incluse des noms des fichiers pour une simulation IPSL 
    414 }}} 
    415  
    416 Exemple avec erreur. A noter le code retour non nul : 
    417  {{{ 
    418 Example (with errors) : 
    419 > pwd 
    420 IGCM_OUT/IPSLCM5A/DEVT/pdControl/SX81210  
    421 > check_expe_files_size.sh  -Z -R ATM/Output 
    422 quiet : 0 recursion : 1 - examsize : 1 - dir - ATM/Output -- subdir -- maxyearp1 : 9999 
    423 48 files proceeded. 
    424 Years occurring : 2000 
    425 Years tested : 2000 
    426 File name patterns and holes (if any) : 
    427                                        ./DA/SX81210_YYmmdd_YYmmdd_1D_histday.nc :  
    428                                         ./HF/SX81210_YYmmdd_YYmmdd_HF_histhf.nc :  
    429                                        ./MO/SX81210_YYmmdd_YYmmdd_1M_histmth.nc : 200011 
    430                                     ./MO/SX81210_YYmmdd_YYmmdd_1M_histmthNMC.nc :  
    431  
    432 Size verification per month (if different) : 
    433                                        ./DA/SX81210_YYmmdd_YYmmdd_1D_histday.nc :  
    434                                         ./HF/SX81210_YYmmdd_YYmmdd_HF_histhf.nc :  
    435                                        ./MO/SX81210_YYmmdd_YYmmdd_1M_histmth.nc : [11] 
    436                                     ./MO/SX81210_YYmmdd_YYmmdd_1M_histmthNMC.nc :  
    437 > echo $? 
    438 1 
    439 }}} 
    440  
    441  
    442 [[BR]][[BR]] 
    443 == Comment boucher un trou cad relancer une simulation pour refaire les fichiers d'un mois complet? == 
    444  
    445 Saperlipopette, j'ai perdu un fichier! Il s'agit du mois d'octobre 1932 de la simulation ARGENT. Que dois-je faire pour le recréer? 
    446  
    447 Pour boucher un trou, il faut refaire exactement la même simulation, c'est à dire : 
    448  * sur le serveur de fichiers :  
    449   * supprimer (ou mettre de côté) les autres fichiers du même mois. Utiliser le suffixe 19321031 (ou bien 19321030 si vous êtes en calendrier 360d) pour avoir aussi les fichiers de type Restart. 
    450 {{{ 
    451 cd IGCM_OUT/IPSLCM5A/DEVT/pdControl/ARGENT 
    452 find . -name '*19321031*' -exec rm -f {} \; 
    453 }}} 
    454  * sur la machine de calcul : 
    455    * créer un repertoire dédié spécial : {{{ cp -pr ARGENT ARGENTREDO }}} 
    456    * dans ce nouveau répertoire, modifier le fichier run.card pour avoir les bonnes valeurs des paramètres suivants : 
    457 {{{ 
    458 OldPrefix= ARGENT_19320930 
    459 PeriodDateBegin= 1932-10-01 
    460 PeriodDateEnd= 1932-10-31 
    461 CumulPeriod= xxx # Attention mettre la bonne valeur cad la valeur associé au même mois dans le fichier run.card témoin (ARGENT) 
    462 PeriodState= OnQueue 
    463 }}} 
    464    * modifier le fichier config.card pour ne faire qu'un seul mois ie qu'une seule Period : 
    465 {{{ 
    466 DateEnd= 1932-10-31 
    467 }}} 
    468    * vérifier que l'on prendra exactement le même fichier Bands.  
    469       * Si c'est au delà de la 3ème itération pas de problème, c'est fait automatiquement. 
    470       * Sinon, dans le fichier COMP/lmdz.card, modifier les paramètres LMDZ_NbPeriod_adjust et LMDZ_Bands_file_name ainsi : 
    471 {{{ 
    472 LMDZ_NbPeriod_adjust=0 
    473 # To force usage of this Bands file, put LMDZ_NbPeriod_adjust=0 and replace XXXXXXX by Restart Job Name 
    474 LMDZ_Bands_file_name=${ARCHIVE}/IGCM_OUT/IPSLCM5/CEPRO0/ATM/Debug/CEPRO0_Bands_96x95x39_3prc.dat_3 
    475 }}} 
    476    * relancer la simulation : 
    477 {{{ 
    478 vi run.card # vérifier encore une fois 
    479 vi Job_ARGENT # vérifier les parametres de temps et les noms des Scripts de sortie 
    480 qsub Job_ARGENT  
    481 }}} 
    482  
    483  
    484 [[BR]][[BR]] 
    485 == Comment relancer une simulation à l'identique pour récupérer quelques fichiers de sortie disparus ?  == 
    486  
    487 Ceci est une variante de la question précédente. Elle permet de faire une autre simulation à l'identique mais à côté. Pas besoin de détruire les fichiers sur le serveur de fichiers, on recrée tous les fichiers du mois en question. 
    488  
    489 Exemple : refaire tourner v3.historicalAnt1 car 3 fichiers ont disparu pour 19640930. 
    490  
    491 Actions : 
    492  * Sur le serveur de fichiers : créer les fichiers Restart, mesh_mask et Bands. 
    493 {{{ 
    494 ## Directory 
    495 mkdir ....IGCM_OUT/IPSLCM5A/REDO/historicalAnt/v3.historicalAnt1REDO 
    496 cd ....IGCM_OUT/IPSLCM5A/REDO/historicalAnt/v3.historicalAnt1REDO 
    497 mkdir -p ATM/Restart CPL/Restart ICE/Restart MBG/Restart OCE/Restart SBG/Restart SRF/Restart 
    498 # Restart 
    499 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/ATM/Restart/v3.historicalAnt1_19640831_restart.nc ATM/Restart/v3.historicalAnt1REDO_19640831_restart.nc 
    500 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/ATM/Restart/v3.historicalAnt1_19640831_restartphy.nc      ATM/Restart/v3.historicalAnt1REDO_19640831_restartphy.nc 
    501 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/CPL/Restart/v3.historicalAnt1_19640831_flxat.nc   CPL/Restart/v3.historicalAnt1REDO_19640831_flxat.nc 
    502 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/CPL/Restart/v3.historicalAnt1_19640831_sstoc.nc   CPL/Restart/v3.historicalAnt1REDO_19640831_sstoc.nc 
    503 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/ICE/Restart/v3.historicalAnt1_19640831_restart_icemod.nc ICE/Restart/v3.historicalAnt1REDO_19640831_restart_icemod.nc 
    504 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/MBG/Restart/v3.historicalAnt1_19640831_restart_trc.nc     MBG/Restart/v3.historicalAnt1REDO_19640831_restart_trc.nc 
    505 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/OCE/Restart/v3.historicalAnt1_19640831_restart.nc OCE/Restart/v3.historicalAnt1REDO_19640831_restart.nc 
    506 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/SBG/Restart/v3.historicalAnt1_19640831_stomate_rest.nc    SBG/Restart/v3.historicalAnt1REDO_19640831_stomate_rest.nc 
    507 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/SRF/Restart/v3.historicalAnt1_19640831_sechiba_rest.nc    SRF/Restart/v3.historicalAnt1REDO_19640831_sechiba_rest.nc 
    508 # mesh_mask 
    509 mkdir -p OCE/Output 
    510 cd OCE/Output 
    511 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/OCE/Output/v3.historicalAnt1_mesh_mask.nc v3.historicalAnt1REDO_mesh_mask.nc 
    512 cd ../.. 
    513 # Bands 
    514 mkdir -p ATM/Debug 
    515 cd ATM/Debug 
    516 ln -s ../../../../../PROD/historicalAnt/v3.historicalAnt1/ATM/Debug/v3.historicalAnt1_Bands_96x95x39_3prc.dat_3 v3.historicalAnt1REDO_Bands_96x95x39_3prc.dat_3 
    517 cd ../.. 
    518 }}} 
    519  * Sur la machine de calcul: 
    520    * créer un repertoire dédié spécial : 
    521 {{{ 
    522 cp -pr  v3.historicalAnt1 v3.historicalAnt1REDO 
    523 }}} 
    524    * dans ce nouveau répertoire, modifier le fichier run.card pour avoir les bonnes valeurs des paramètres suivants : 
    525 {{{ 
    526 OldPrefix= v3.historicalAnt1REDO_19640831 
    527 PeriodDateBegin= 1964-09-01 
    528 PeriodDateEnd= 1964-09-30 
    529 CumulPeriod= xxx # Attention mettre la bonne valeur cad la valeur associé au même mois dans le fichier run.card témoin (ARGENT) 
    530 PeriodState= OnQueue 
    531 }}} 
    532    * modifier le fichier config.card pour ne faire qu'un seul mois (ie qu'une seule Period), ne pas faire les Post-traitements et lancer rebuild à la fin du mois refait. 
    533 {{{ 
    534 JobName=v3.historicalAnt1REDO 
    535 ... 
    536 SpaceName=REDO 
    537 ... 
    538 DateEnd= 1964-09-30 
    539 ... 
    540 RebuildFrequency=1M 
    541 ... 
    542 TimeSeriesFrequency=NONE 
    543 ... 
    544 SeasonalFrequency=NONE 
    545 }}} 
    546    * relancer la simulation : 
    547 {{{ 
    548 vi run.card # vérifier encore une fois 
    549 mv Job_v3.historicalAnt1 Job_v3.historicalAnt1REDO 
    550 vi Job_v3.historicalAnt1REDO # vérifier les parametres de temps et les noms des Scripts de sortie 
    551 qsub Job_v3.historicalAnt1REDO  
    552 }}} 
    553   * une fois le job fini, vérifier que les solver.stat sont bien identiques : 
    554  {{{ 
    555 sdiff  OCE/Debug/v3.historicalAnt1REDO_19640901_19640930_solver.stat /dmnfs11/cont003/p86maf/IGCM_OUT/IPSLCM5A/PROD/historicalAnt/v3.historicalAnt1/OCE/Debug/v3.historicalAnt1_19640901_19640930_solver.stat 
    556 }}} 
    557  
    558  
    559  
    560 [[BR]][[BR]] 
    561 == comment repérer les simus à refaire éventuellement lorsque le CCRT prévient qu'une bande est irrécupérable et listent les fichiers perdus? == 
    562 Si vous avez reçu un message du CCRT donnant une liste de fichiers perdus à cause d'un accident de bande, vous aurez envie d'avoir une synthèse des périodes impactées et des éventuels relance de simus à faire. 
    563 Le script : check_ccrt_files.sh disponible là : [browser:TOOLS/CHECKscripts]  permet de faire cela. 
    564  1. Il suffit de lui passer en paramètre le nom d'un fichier contenant la liste des fichiers perdus. 
    565  2. Il répond en donnant l'intervalle complet et en détaillant les fichiers perdus par famille. 
    566  
    567 Exemple : 
    568 {{{ 
    569 check_ccrt_files.sh liste 
    570 }}} 
    571  
    572 Exemple d'affichage  : 
    573 {{{ 
    574 check_ccrt_files.sh liste 
    575  
    576 HOL03 
    577 5 files proceeded. 
    578 ===> Année à refaire? ==> Years occurring : 1787 
    579 File name patterns and holes (if any) : 
    580 /dmnfs11/cont003/login/SORTIES_CPL_IPSL/HOL03/Atm/Output/HF/HOL03_1m_YYmmdd_YYmmdd_histhf.nc : 178709 
    581 /dmnfs11/cont003/login/SORTIES_CPL_IPSL/HOL03/Atm/Output/MO/HOL03_1m_YYmmdd_YYmmdd_dyn_hist_ave.nc : 178709 
    582 /dmnfs11/cont003/login/SORTIES_CPL_IPSL/HOL03/Atm/Output/MO/HOL03_1m_YYmmdd_YYmmdd_dynzon.nc : 178711-178712 
    583 /dmnfs11/cont003/login/SORTIES_CPL_IPSL/HOL03/Atm/Output/MO/HOL03_1m_YYmmdd_YYmmdd_histmth.nc : 178712 
    584 HOL04 
    585 5 files proceeded. 
    586 ===> Année à refaire? ==> Years occurring : 2252 
    587 File name patterns and holes (if any) : 
    588 /dmnfs11/cont003/login/SORTIES_CPL_IPSL/HOL04/Oce/Output/MO/HOL04_1m_YYmmdd_YYmmdd_grid_T.nc : 225209-225210 
    589 /dmnfs11/cont003/login/SORTIES_CPL_IPSL/HOL04/Oce/Output/MO/HOL04_1m_YYmmdd_YYmmdd_grid_U.nc : 225210 
    590 /dmnfs11/cont003/login/SORTIES_CPL_IPSL/HOL04/Oce/Output/MO/HOL04_1m_YYmmdd_YYmmdd_grid_V.nc : 225210 
    591 /dmnfs11/cont003/login/SORTIES_CPL_IPSL/HOL04/Oce/Output/MO/HOL04_1m_YYmmdd_YYmmdd_grid_W.nc : 225210 
    592 ... 
    593 }}} 
     231