Version 45 (modified by omamce, 13 years ago) (diff) |
---|
Performances IPSLCM5A
2011
Ressources disponibles
/!\ Plus de vectoriel : ni Brodie (IDRIS) ni Mercure SX-8R (CCRT)
Centre | Supercalculateurs | Estimation des ressources disponibles DARI 2012- 1ère session |
CINES | IBM Power7 - Yoda | 920 300 |
SGI ICE - Jade | 111 055 000 | |
IDRIS | IBM SP – Vargas | 18 288 000 |
IBM BG/P - Babel | 198 956 000 | |
CCRT | Bull Xéon – Titane | 33 064 000 |
Bull Xéon – Titane noeuds hybrides GPU | 920 000 | |
TGCC | Bull - Curie nœuds larges | 6 902 000 |
Bull - Curie nœuds fins | 40 500 000 | |
Bull - Curie nœuds hybrides GPU | 144 000 |
Dossier technique
Dossier technique pour les demandes d'heures 2012 : voir les fichiers attachés en bas de page.
Performances connues
IDRIS IBM vargas
- Les post-traitements des simulations faites sur vargas se font actuellement sur ulam. Nous rencontrons des difficultés insurmontables dans les post-traitements sur ulam et en l'état, il est impossible de réaliser des simulations de type CMIP5 (historical) en production.
- Il faudrait pouvoir post-traiter les simulations faites sur vargas sur vargas elle-même. Il s'agit des jobs de rebuild, TS et Monitoring, SE et ATLAS. Pour cela il faudrait sur vargas :
- disposer des outils nco et C° nécessaires (rappeler la liste svp)
- avoir la possibilités de lancer jusque 150 jobs à la fois, en classe scalaire sur vargas. C'est ce que peut soumettre le script TimeSeriesChecker de vérification des TS
- avoir la possibilité de tourner une vingtaine de jobs de type scalaire simultanément par utilisatueur
- disposer de l'espace TMPDIR nécessaire à ces jobs de post-traitements qui tourneraient simultanément.
- Il faudrait pouvoir post-traiter les simulations faites sur vargas sur vargas elle-même. Il s'agit des jobs de rebuild, TS et Monitoring, SE et ATLAS. Pour cela il faudrait sur vargas :
- Chiffrages issus de la simu v3.historicalV52 qui a tourné entre mai et juin 2011 :
- Une simulation de type historical (1850-2006, 157 ans) tourne en lançant 40 jobs enchainés sur vargas (<10h).
- L'execution s'est étalée sur une période de 1 mois environ. Elle a lancé au fur et à mesure les jobs de post-traitements sur ulam puis le rattrapage des TS a été lancé à la main. En tout :
- 156 jobs de rebuilds, (<10h) + 9 à refaire à la main à cause de souci d'accès aux fichiers gaya (arrêts désynchronisés)
- 15 jobs de SE (moyennes saisonnières), (<10h)
- 30 jobs de monitoring (<1h)
- 45 jobs d'atlas (<1h)
- 464 jobs de TimeSeries (TS) en direct (<20h)
- 166 jobs de TS (<20h) de rattrapage (via le script TimeSeriesChecker)
- Les jobs de TS peuvent partir en time limit exceeded. Le max de temps réel étant actuellement de 20h.
- Estimation du temps réel nécessaire sur vargas pour les post-traitements : 20%
- pour une simulation de type historical avec sorties HF activées :
- 4 000 h de post-traitement (temps réel) sur vargas.
- 20 000 h de temps réel en calcul pour la simu elle-même.
- pour une simulation de type historical avec sorties HF activées :
IPSLCM5A
Mesure consommation 10 ans pour résolution 96x95x39 - ORCA2
machine | Nb CPU | Temps réel | Temps à demander |
vargas (IDRIS) | 32 (5 océan + 26 atmosphère) | 40 h | 40x32 = 1 300h |
Attention aux ressources pour le post-traitement. Estimation pour post-traitement sur vargas : 20%
Estimation consommation 10 ans pour résolution 144x142x39 - ORCA2
machine | Nb CPU | Temps réel | Temps à demander |
vargas | 64 (16 océan + 1 oasis + 47 atm | 7h par an | 70x64 = 4 500h |
Test 1 an OK. Voir : Monitoring VERIF092011 IPSLCM5A-MR
Attention aux ressources pour le post-traitement. Pas encore d'estimation à ce jour.
LMDZOR
Ancienne physique résolution 96x95x39, estimation consommation 10 ans
machine | Nb CPU | Temps réel / mois | Temps réel total | Temps à demander |
vargas (IDRIS) | 32 | 15 min | 30 h | 30x32 = 960h |
Nouvelle physique NPv3 résolution 96x95x39, estimation consommation 10 ans
machine | Nb CPU | Temps réel / mois | Temps réel total | Temps à demander |
vargas (IDRIS) | 32 | 35 min | 70 h | 70x32 = 2240h |
Ancienne physique résolution 144x142x39, estimation consommation 10 ans
machine | Nb CPU | Temps réel / mois | Temps réel total | Temps à demander |
vargas (IDRIS) | 32 | 30 min | 62 h | 62x32 = 2000h |
Nouvelle physique NPv3 résolution 144x142x39, estimation consommation 10 ans, NB: temps avec iphysiq=5
machine | Nb CPU | Temps réel / mois | Temps réel total | Temps à demander |
vargas (IDRIS) | 32 | 100 min | 210 h | 210x32 = 6700h |
CCRT Bull titane
2 difficultés majeurs sur titane :
- Les post-traitements des simulations faites sur titane (et sur le SX9) se font actuellement sur cesium. Nous rencontrons des difficultés car cesium est trop petite pour absorber toute la charge des post-traitements.
- Une première action a été de faire les rebuild sur la frontale de titane. Utiliser libIGCM_v1_11 pour cela.
- Pour pouvoir faire tous les post-traitements sur titane il faudrait :
- disposer des outils nco et C° nécessaires (rappeler la liste svp)
- avoir la possibilités de lancer jusque 150 jobs à la fois, en classe scalaire sur titane. C'est ce que peut soumettre le script TimeSeriesChecker de vérification des TS
- avoir la possibilité de tourner une vingtaine de jobs de type scalaire simultanément par utilisateur
- disposer de l'espace TMPDIR nécessaire à ces jobs de post-traitements qui tourneraient simultanément.
- Le nombre d'inodes sur /dmnfs
- Une simulation de type historical produit plus de 120 000 fichiers.
- Les répertoires ATLAS et MONITORING sont sur /dmnfs pour être accessibles par dods.
- Au TGCC, il est prévu d'avoir un 2ème espace visible depuis dods. Quand ce sera prêt on stockera les ATLAS (20 000) et MONITORING (400 fichiers) là et on en fera un tar pour stocker un seul fichier sur STOREDIR
- Les fichiers de type Analyse et SE (2000 fichiers) resteront en l'état. A noter ils sont également visible depuis dods. Il y aura donc 2 serveurs dods.
- Les fichiers de type Restart (22 000 fichiers) seront gardés une fois par an au lieu de une fois par mois de simulation. (2 000 fichiers au final)
- Les fichiers de type Output seront regroupés (commande nccat) par an dans un répertoire Packed (au lieu de Output). Regroupement par 10 ans pou IPSLCM5A-LR et par 5 ans pour IPSLCM5A-MR.
- Les fichiers de type texte seront regroupés par an ou plus (cat).
- Les répertoires ATLAS et MONITORING sont sur /dmnfs pour être accessibles par dods.
- Une simulation de type historical produit plus de 120 000 fichiers.
- Le travail de développement nécessaire est important et un soutien ingénieur spécifique est demandé. Besoins déjà répertoriés :
- script de Package/Verification/Ménage, modification des scripts de TS pour tenir compte de la nouvelle arborescence, diffusion de cette pratique à tous, ...
- mise en place d'un cache dans la chaine pour stocker les fichiers produits par les simus, les accéder depuis les jobs de post-traitements et stocker in fine sur SCRATCHDIR des fichiers qui ne seront plus utilisés par la chaine de production.
Voir aussi BasculeCCRTTGCC
IPSLCM5A
Mesure consommation 10 ans Résolution 96x95x39 - ORCA2 (sorties "légères")
machine | Nb CPU | Temps réel | Temps à demander |
titane | 32 | 35 h | 1120 h |
Attention aux ressources pour le post-traitement.
Attention au nombre de fichiers sur le stockage.
Mesure consommation 10 ans Résolution 144x142x39 - ORCA2
machine | Nb CPU | Temps réel | Temps à demander |
titane | 64 | ?? | ?? |
Test en cours (20/9/2011)
Attention aux ressources pour le post-traitement.
Attention au nombre de fichiers sur le stockage.
Configuration Forcée : LMDZOR
Ancienne physique résolution 96x95x39, estimation consommation 10 ans
machine | Nb CPU | Temps réel / mois | Temps réel total | Temps à demander |
titane (CCRT) | 32 | 16 min | 32 h | 32x32 = 1024h |
Ancienne physique résolution 144x142x39, estimation consommation 10 ans
machine | Nb CPU | Temps réel / mois | Temps réel total | Temps à demander |
titane(CCRT) | 32 | 40 min | 80 h | 80x32 = 2560h |
Configuration Forcée : LMDZORINCA
Vous trouverez les renseignements sur cette page
TGCC Bull curie noeuds larges
Attention : pas d'environnement modipsl/libIGCM à ce jour.
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
curie | 32 | 46 h | 1472 h |
TGCC Bull curie noeuds fins
TGCC Bull curie noeuds hybrides
Performances estimées
CINES : l'environnement des simulations IPSL n'est pas installé.
CINES IBM yoda
Pas de performances connues
CINES SGI jade
Grand challenge
NEMO (Drakkar)
Attention : pas d'environnement modipsl/libIGCM à ce jour.
IPSLCM5A : 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
jade | 32 | 60h | 1920 h |
IDRIS BlueGene Babel
Utilisation non conseillée. Tests avec NEMO seulement.
CCRT Bull titane GPUs
Pas d'utilisation recensée à ce jour.
2010
Informations supprimées. Voir l'historique des changements pour les retrouver si besoin.
Attachments (12)
-
DossierTechnique_2012.doc
(154.5 KB) -
added by omamce 13 years ago.
Dossier technique pour les demandes d'heures 2012
- Comp-convergence-clim-t2m-slp-precip-calculateurs.pdf (20.5 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-demande-v2.doc (776.5 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-demande-v2.pdf (937.8 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-bilan-v2.doc (96.5 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-bilan-v2.pdf (163.1 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-publi-v2.doc (101.5 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-publi-v2.pdf (108.8 KB) - added by mafoipsl 12 years ago.
- Comp-convergence-clim-t2m-precip-slp-calculateurs-new-200yrdist2.jpg (106.3 KB) - added by mafoipsl 11 years ago.
- Ressources-calcul-sept2013.pdf (416.4 KB) - added by mafoipsl 11 years ago.
- DossierTechnique_2013_v2.pdf (1.1 MB) - added by mafoipsl 11 years ago.
- DossierTechnique_2013_v2.doc (544.5 KB) - added by mafoipsl 11 years ago.