Version 11 (modified by mafoipsl, 15 years ago) (diff) |
---|
Performances IPSLCM5
Cette page décrit les ressources nécessaires pour le couplé IPSLCM5 sur les différentes machines disponibles et pour les différentes résolutions utilisées. Sur certaines machines, seuls les temps de LMDZ ou NEMO sont indiqués. Elle prend la suite de la page wiki:PerformancesIPSLCM4_v2 écrite en 2008 avec des informations actualisées au 13/10/09.
Les détails sur le nombre d'heures disponibles sont là : http://www.genci.fr/spip.php?article53
En résumé, par rapport à 2008 :
- le couplé en 39 niveaux prend 2 fois plus de temps qu'en 19 niveaux.
- le couplé en 144x142 prend 2,5 fois plus de temps que le couplé en 96x95
- toutes ces mesures sont sans aérosols
- Machines massivement parallèles :
- On sait faire tourner le couplé sur platine/titane et vargas moyennant quelques modifs connues. Ne pas hésiter à demander beaucoup d'heures dessus.
- Il faut demander 10 fois plus de temps sur platine que sur les NEC (mercure/brodie)
- Il faut demander 8 fois plus de temps sur vargas que sur les NEC (mercure/brodie)
- Il faut demander 5 fois plus de temps sur titane que sur les NEC (mercure/brodie)
- Demander autant d'heures avec ou sans OpenMP. La parallélisation mixte OpenMP/MPI permettra :
- de demander plus de processeurs (limitation à jpj/3 avec MPI seul),
- de réduire les temps d'exécution
- mais ne diminue pas le temps calcul
- Pas de demande explicite sur la SX-9 dédiée GIEC.
CCRT
NEC SX-8R
Heures disponibles : Pas d'info à ce jour.
Attention, on compte en temps réel sur le CCRT. Multiplier temps réel par le nombre de processeurs.
Le NEC SX-8R du CCRT (mercure) va plus vite que le NEC SX-8 de l'IDRIS (brodie) : 20% de mieux environ.
Résolution 44x43x19 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
mercure (CCRT) | 4 | 16 h | 4 GB (3.2 GB) | <7h30 | 30 h |
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans (Validé)
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
mercure (CCRT) | 4 | 130 h | 8 GB | 40 h | 160 h |
Résolution 144x142x39 - ORCA2
Mesure consommation 10 ans (Validé)
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
mercure (CCRT) | 8 | 310 h | 20 GB | 45 h | 360 h |
Machine dédiée GIEC
Il s'agit du NEC SX-9. Seul un rapport d'activités sur ce qui a été fait depuis mai 2009 est demandé. Les heures demandées sur le NEC SX-9 sont prises en charge par le projet IPSL de Jean-Louis Dufresne qui avait été prévu sur 2 ans.
Bull Itanium : platine
Heures disponibles : pas d'informations à ce jour.
Résolution orca2- lmd 56x55x19
A cette résolution la, 1 process MPI Atm prend 4 fois plus de temps qu'un process MPI oce. Donc, un couple equilibre nous donne en MPI la configuration suivante :
- 18 ATM + 5 OCE (cad 24 CPUs ou 3 noeuds de calcul) : 380s/mois
On est a la limite du nombre de process MPI possible.
En activant l'openMP cote ATM, on obtient la configuration equilibree suivante :
- 16 process ATM MPI (x 4 taches OpenMP) + 7 OCE (soit 72 CPus ou 9 noeuds) : 240s/mois
Pour comparaison avec mercure (d'apres les perfs sur ta page wiki Luc) :
- 4 CPUs (2 ATM + 1 OCE + 1 OASIS) : 250s/mois
Résolution 56x55x19 - ORCA2
Mesure consommation 10 ans (Validé)
machine | Nb CPU | Temps réel | Temps à demander |
platine | 24 (18 atm + 5 oce + 1 oas) | 13 h | 312 h |
Résolution 96x95x39 - ORCA2
Estimation consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
platine | 20 | 50 h | 2000 h |
Résolution 144x142x39 - ORCA2
Mesure consommation 10 ans (Validé)
machine | Nb CPU | Temps réel | Temps à demander |
platine | 48 (46 atm + 1 oce + 1 oas) | 90 h | 4 300 h |
Bull Xeon : titane
Heures disponibles : 38,7 millions
CINES
SGI Xeon : jade
Heures disponibles : 68,7 millions
NEMO tourne sur jade dans sa configuration ORCA025 :
- sur 864 coeurs, 1728 CPUs réservés, utilisation de 4 coeurs/8
- 1 an, sorties mensuelles : 3h de temps réel, comptabilisé : 5184h
- domaine = 1442 x 1021 x 46, rdt=1440 sec, decoupage 62 x 18 = 864 (1116 - 252 domains sans océan)
IDRIS
NEC SX-8 : brodie
Heures disponibles : 480 000h
Attention, on compte en temps CPU sur le NEC de l'IDRIS.
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans (Validé)
machine | Nb CPU | Temps CPU | Mémoire | Temps réel |
brodie (IDRIS) | 4 | 160 h | 5 GB | 40 h |
Résolution 144x142x39 - ORCA2
Mesure consommation 10 ans (Validé)
machine | Nb CPU | Temps CPU | Mémoire | Temps réel |
brodie (IDRIS) | 8 | 400 h | 12 GB | 55 h |
Résolution 144x142x39 - ORCA05
Estimation consommation 10 ans
machine | Nb CPU | Temps CPU | Mémoire | Temps réel |
brodie (IDRIS) | 16 (12 océan + 4 atmosphère) | 1600 h | 60 GB | 100 h |
LMDZ sur brodie
LMDZ 96x72x50
Nb CPUS | Durée | Sorties | Temps réel | Temps CPU cumulé | Mémoire | |
options prod, MPI | 8 | 5 ans | 2GB/mois histhf | 11 h | 70 h | 11 GB |
= | 4 | 1 an | = | 4 h | 14 h | 7 GB |
LMDZ4OR_v3 96x95x39
Nb CPUS | Durée | Temps réel |
4 | 10 ans | 21 mn/mois |
IBM Power6 : vargas
Attention sur vargas, on compte en temps réel
Résolution 96x95x19 - ORCA2
Mesure consommation 10 ans (Validé)
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
vargas (IDRIS) | 32 (6 océan + 25 atmosphère) | 800 h | - | 25 h | 800h |
Résolution 144x142x39 - ORCA2
Mesure consommation 10 ans (Validé)
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
vargas (IDRIS) | 32 (1 + 1 + 30) | 3000 h | - | 100 h | 3200 h |
Résolution 96x71x19 LMDZ forcé
LMDZ4 head, flag de l'ancienne physique, mixte MPI/OPENMP (avec plus grand nombre de processeurs possible).
(A valider)
Estimation consommation 10 ans
machine | Nb CPU | Temps réel |
vargas (IDRIS) | 16 | 36 h |
vargas (IDRIS) | 32 | 21 h |
vargas (IDRIS) | 48 | 15 h |
vargas (IDRIS) | 64 | 12 h |
vargas (IDRIS) | 96 | 9 h |
NEMO tourne sur vargas dans sa configuration ORCA025 :
- sur 186 processeurs
- 1 an, sorties mensuelles : 6h de temps réel
- domaine = 1442 x 1021 x 46, rdt=1440 sec
IBM Blue Gene : babel
Heures disponibles : 232 millions
On ne fera pas tourner le couplé IPSL sur cette machine. Trop peu de mémoire par processeurs.
Demande d'accès pour des tests des composantes seules.