Changes between Version 13 and Version 14 of BasculeCCRTTGCC/Prestation_CCRT_TGCC


Ignore:
Timestamp:
10/25/12 17:08:12 (12 years ago)
Author:
aclsce
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • BasculeCCRTTGCC/Prestation_CCRT_TGCC

    v13 v14  
    3434 * Aide au démarrage de la migration (lien entre le TGCC et l’IPSL) 
    3535 
    36 == Documentation == 
     36'''Documentation''' 
    3737 
    3838Une documentation de l'outil de traitement des données développé par l'IPSL est disponible là : [attachment:"Doc_outil_pack_IPSL_v2.pdf"] 
    3939 
     40== Lot 3 : Audit et évaluation de la chaîne de calcul de l’IPSL == 
    4041 
     42'''Objectif de la prestation'''[[BR]] 
     43 
     44Conformément au cahier des charges, le Lot 3 porte sur l'audit de la chaîne de production (calcul et post-traitement) de l'IPSL. 
     45La prestation consistera à évaluer cette chaîne de production : 
     46 * sur les machines du CCRT/TGCC : mercure (calcul + post)  et curie (calcul + post) 
     47 * sur les machines de l'IDRIS : vargas (calcul) et ulam (post). 
     48Les critères d'évaluation de l'audit seront la "fiabilité" et l'"efficacité". 
     49Le critère de "facilité d'utilisation" n'est pas prioritaire. Il pourra cependant être rediscuté de ce critère là en fin de prestation, en fonction de l'avancement de cette dernière. 
     50Il sera fourni en fin du Lot 3, un document décrivant et analysant, suivant ces critères-là, la chaîne de calcul de l'IPSL. 
     51 
     52'''Rapport de l'audit'''[[BR]] 
     53 
     54Le rapport final pourra être décomposé de la façon suivante : 
     55 * Description : une description globale de la chaîne de calcul de l'IPSL. Il ne s'agira pas là de rentrer dans les détails mais plutôt d'introduire les analyses à venir. 
     56 * Analyse : une analyse de la chaîne de calcul sera réalisée. 
     57Le critère de fiabilité sera évalué : il s'agira de déterminer la capacité de la chaîne, sur un machine particulière, à permettre de réaliser une simulation sans avoir besoin d'intervention humaine. 
     58Il s'agira aussi, le cas échéant, d'estimer les causes de plantage et le temps passé à résoudre cela. 
     59Pour traiter le critère d'efficacité, il s'agira d'évaluer l'adéquation chaîne de calcul/centre de calcul et de mettre en avant les mauvais points en termes de performances. 
     60 * Conclusion : les conclusions attendues sont de plusieurs types : 
     61  * adéquation chaîne de calcul/centre de calcul ET centre de calcul/chaîne de calcul : conseils d'amélioration. 
     62  * idées/conseils pour instrumenter la chaîne afin d'affiner et faciliter les analyses ultérieures de fiabilité. 
     63  * mise en évidence du temps humain/temps machine. 
     64Ce rapport sera destiné à une diffusion interne IPSL et externe (centres de calcul) et servira de base dans les dialogues entre l'IPSL et les centres de calcul. 
     65 
     66'''Détail de la prestation'''[[BR]] 
     67 
     68L'analyse de la chaîne de calcul se fera au travers de simulations "type" de l'IPSL ayant déjà tourné sur les machines du CCRT/TGCC et l'IDRIS. 
     69Trois simulations seront étudiées : 
     70 * une simulation avec calcul et post-traitement sur Curie (TGCC) 
     71 * une simulation avec calcul sur Vargas(IDRIS) et post-traitement sur Ulam(IDRIS) 
     72 * une simulation avec calcul et post-traitement sur Mercure (CCRT) 
     73Il sera éventuellement question d'analyser plusieurs simulations ayant tourné sur Curie. Il parait en effet intéressant d'étudier des simulations ayant tourné à des périodes différentes sur un même calculateur. 
     74Ce point sera confirmé ultérieurement. 
     75 
     76Les données a extraire d'une simulation et permettant l'analyse d'un simulation doivent être déterminées. Elles seraient de plusieurs types : 
     77 * globales (ensemble de la simulation) : temps de restitution , temps d'attente, nombre de jobs,... 
     78 * par type de job : temps de restitution, temps d'attente, nombre de jobs,... 
     79 * par séquence : temps de restitution, temps d'attente, nombre de jobs,... 
     80 
     81Le choix pertinent des données à extraire et à analyser est une tâche de la prestation. 
     82 
     83'''Tâches à réaliser'''[[BR]] 
     84 
     85 * prise en main de la chaîne de calcul et formation à son utilisation. 
     86 * lancement et analyse d'une simulation type de 10 ans sur les calculateurs Curie (TGCC) et Vargas-Ulam (IDRIS). 
     87 * choix de l'information utile a extraire d'une simulation. 
     88 * développement de scripts d'extraction de cette information :  
     89  * temps de calcul, temps de restitution, temps d'attente d'un job,...) à partir des scripts de sortie d'une simulation donnée. 
     90  * part des tâches au sein d’un job  
     91 * analyse de la chaîne de calcul suivant les critères d'étude choisis. 
     92 * écriture du rapport