wiki:PerformancesIPSLCM6

Version 31 (modified by acosce, 10 years ago) (diff)

--

Performances IPSLCM6 et demandes d'heures

Cette page liste quelques performances mesurées et estimées du modèle IPSLCM6. Il rappelle également les ressources calcul disponibles au niveau national et européen en 2015 et les dates clés.

Pour mémoire : année précédente avec IPSLCM5A : wiki:PerformancesIPSLCM5A.

Modifications

  • 7/10/2014 :
    • modification chiffrage IPSLCM6-VLR
    • ajout chiffrage IPSLCM6-XLR, idem IPSLCM5A-MR, configuration a priori non supportée.

Ressources disponibles en 2015

Centre Supercalculateurs Estimation des ressources disponibles DARI 2015 (tier 1) Prace (tier 0)
CINES Bull - Occigen 233 000 000 -
IDRIS IBM Noeuds larges - Ada 53 100 000 -
IBM BG/Q - Turing 345 560 000 -
TGCC Bull - Curie nœuds larges 10 880 000 28 000 000
Bull - Curie nœuds fins 67 420 000 201 000 000
Bull - Curie nœuds hybrides GPU 294 000 600 000

Projet 0826

Le projet 0826, intitulé : "Développement du système couplé IPSL et partage de données." demande un petit peu d'heures sur toutes les machines disponibles et les espaces nécessaires pour les données partagées. Si vous voulez tester une machine : turing ou occigen, par exemple, n'hésitez pas à demander à en faire partie. contact MA Foujols.

Mésocentre IPSL

Nous avons fait apparaître le mésocentre IPSL dans la liste des méso-centres. Il s'agit de l'ensemble CICLAD+CLIMSERV que nous avons identifié ainsi. N'hésitez pas à le citer dans votre demande d'heures. Il suffit juste de le sélectionner dans la liste des mésocentres proposés sur le site WWW.

Mais aussi à l'UPMC

Dossier technique

Dossier technique pour les demandes d'heures 2015. Avec les performances IPSLCM5. Version 1 du 15/10/2014 : dossier technique IPSL en pdf et dossier technique IPSL en doc

Performances estimées :

Les 3 machines ada (IDRIS), curie (TGCC) et occigen (CINES) ont presque les mêmes performances. Par souci de simplicité on donne un seul tableau de performances. Voir plus loin les spécificités des centres.

IPSLCM5A-LR

Pour mémoire, IPSLCM5A-LR sur ada l'an dernier.

Mesure consommation 10 ans pour résolution 96x95x39 - ORCA2

machine Nb CPU Temps réel/mois Temps réel Temps à demander
ada 32 (5 océan + 26 atmosphère + 1 coupleur) 1000 s 36 h 36x32 = 1 200h

IPSLCM6

Tableau des résolutions

Configuration Comment Océan Atmosphère Nb OpenMP atm Nb MPI atm Nb MPI oce Nb IO server Nb total de coeurs
IPSLCM5A MPI seul (CMIP5) 182 142 31 96 95 39 1 26 5 32
IPSLCM6-VLR (idem IPSLCM5A-LR CMIP5) MPI-OpenMP (idem IPSLCM5A-LR CMIP5) 182 142 31 96 95 39 4 27 19 1 128
IPSLCM6-XLR (idem IPSLCM5A-MR CMIP5, non supportée) MPI-OpenMP 182 142 31 144 142 39 4 47 19 1 208
IPSLCM6-LR MPI-OpenMP (Nouvelle physique) 362 292 75 144 142 79 8 47 67 1 443
IPSLCM6-LR et aérosols interactifs MPI-OpenMP (Nouvelle physique) 362 292 75 144 142 39 4 47 67 1 256
IPSLCM6-LR et chimie MPI-OpenMP (Nouvelle physique) 362 292 75 144 142 39 4 47 67 1 256
IPSLCM6-MR MPI-OpenMP (Nouvelle physique) 362 292 75 280 280 79 8 92 67 1 803
IPSLCM6-HR MPI-OpenMP (Nouvelle physique) 1442 1021 75 280 280 79 8 92 592 1 1 328

Tableau des performances IPSLCM6

Configuration Commentaire Nb total de coeurs Temps réel pour 10 ans Temps à demander pour 10 ans
IPSLCM5A MPI seul 32 36h 1 000 h
IPSLCM6-VLR (idem IPSLCM5A-LR) MPI-OpenMP 128 10h 1 300 h
IPSLCM6-VLR-CHT(idem IPSLCM5CHT-LR) MPI-OpenMP 128 25h 3200 h
IPSLCM6-XLR (idem IPSLCM5A-MR) MPI-OpenMP 208 15h 3 200 h (estimation)
IPSLCM6-LR MPI-OpenMP 443 40 h 17 800 h (estimation)
IPSLCM6-LR et aérosols interactifs MPI-OpenMP 443 80 h 35 440 h (estimation)
IPSLCM6-LR et chimie MPI-OpenMP 256 200 h 51 200 h (estimation)
IPSLCM6-MR MPI-OpenMP 803 80 h 64 300 h (estimation)
IPSLCM6-HR MPI-OpenMP 1 328 80 h 107 000 h (estimation)

Et pour les fichiers ?

Configuration Commentaire Océan Atmosphère Facteur multiplicatif fichiers atm 3D atm 2D Facteur multiplicatif fichiers océan 3D océan 2D
IPSLCM5A MPI seul 182 142 31 96 95 39 1 1 1 1
IPSLCM6-VLR (idem IPSLCM5A-LR) MPI-OpenMP 182 142 31 96 95 39 1 1 1 1
IPSLCM6-XLR (idem IPSLCM5A-MR) MPI-OpenMP 182 142 31 144 142 39 2,2 2,2 1 1
IPSLCM6-LR MPI-OpenMP 362 292 75 144 142 79 4,5 2,2 10 4
IPSLCM6-LR et aérosols interactifs MPI-OpenMP 362 292 75 144 142 39 2,2 et aérosols 2,2 et aérosols 10 4
IPSLCM6-LR et chimie MPI-OpenMP 362 292 75 144 142 39 2,2 et chimie 2,2 et chimie 10 4
IPSLCM6-MR MPI-OpenMP 362 292 75 280 280 79 17 4 10 4
IPSLCM6-HR MPI-OpenMP 1442 1021 75 280 280 79 17 4 130 54

Particularités des centres

IDRIS IBM - Ada

  • La machine va un peu moins vite que curie.
  • Les post-traitements se font sur des noeuds dédiés adapp et ne sont pas comptés. Il n'est donc pas nécessaire de demander des ressources pour les post-traitements.
  • Rappel : il faut de l'ordre de 20 To par personne sur le WORKDIR pour faire tourner les chaînes de calcul. Demander les quotas nécessaires dès que possible sur le serveur intranet de l'IDRIS.

TGCC Bull curie

  • Il faut bien préciser les besoins, en particulier en production :
    • Pour faire de la production, il faut enchaîner les jobs de calcul. Le calcul de priorité actuel tient compte des heures déjà consommées, autrement dit plus on a consommé, plus on attendra avant de rentrer en exécution. Ceci rend impossible la production basée sur l'enchaînement de jobs lancés les uns par les autres lorsque le projet est 'en avance' dans sa consommation (ccc_myproject).
  • Une demande collective unique d'extension du nombre d'inodes IPSL sera faite fin 2014. A suivre.
    • Pour avoir plus de quotas sur CCCSTOREDIR, il faut avoir un bon score ( noté sur 20 : 13/20 dans l'exemple) pour les obtenir. De plus, toute dérogation a une date limite. 15/1/2015 pour la plupart. Attention à être inclus dans la demande d'extension inodes IPSL annuelle.
    • ccc_quota vous donne votre occupation sur les différents espaces, en espace et en nombre d'inodes.
      > ccc_quota
      Disk quotas for user xxxxxx (uid xxxxx):
      
                   ------------------- SPACE --------------------  ------------------- INODE --------------------
       Filesystem       usage        soft        hard       grace     entries        soft        hard       grace
       ----------       -----        ----        ----       -----     -------        ----        ----       -----
             home     543.34M          3G          3G           -           -           -           -           - 
          scratch       1.56T         20T         20T           -      76.03k          2M          2M           - 
             work     328.15G       9.31T       9.31T           -       1.13M          3M          3M           - 
            store           -           -           -           -     512.61k        550k        551k           - 
      
      Account scoring:
      ----------------
      Filesystem volume(TB)  inodes non_files files<32M  files<1G avg_fsize(MB)    score      score_detail
      store         822.325  512612     2.44%    20.14%    43.50%          1724    13/20      6/6, 3/7, 1/3, 3/4
      
      ...
      

noeuds larges : post-traitement

  • Dans la chaîne IPSL, les post-traitements se font sur curie noeuds xlarge. Il faut donc demander des heures sur noeuds xlarge pour le post-traitement et sur noeuds fins pour les calculs. On conseille de demander 10 % du nombre d'heures demandées sur noeuds xlarge.
  • Depuis septembre 2014, il semble que les noeuds xlarge soient très demandés. On conseille donc de demander 10% sur xlarge pour les post-traitements et 10% sur noeuds fins pour ces mêmes post-traitements pour avoir de la souplesse pendant l'année.

noeuds fins : calculs

  • Bien préciser le nombre d'heures de calcul sur noeuds fins.
  • Ajouter 10% pour les post-traitements qui seront faits sur noeuds fins

CINES Bull occigen

Il est possible de demander des heures en 2015 sur cette machine. En cours, 3 actions :

  • portage de la chaîne IPSL
  • 2 grands challenges soumis avec WRF/NEMO et DYNAMICO (saturne). En attente de l'accord éventuel.

A savoir :

  • peu d'expérience des serveurs de fichiers du CINES à ce jour. Plus d'informations dès que possible.
  • un datanode ESGF existe au CINES

Attachments (23)