Changes between Version 24 and Version 25 of BasculeCCRTTGCC


Ignore:
Timestamp:
12/15/11 16:12:21 (13 years ago)
Author:
aclsce
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • BasculeCCRTTGCC

    v24 v25  
    180180  * sur curie, le post-traitement représentera 10 à 20 % du temps calcul, sera composé d'un grand nombre de jobs scalaires (800 jobs 1 proc pour 40 jobs de calcul 32 procs) . Voir estimatif vargas là : https://forge.ipsl.jussieu.fr/igcmg/wiki/PerformancesIPSLCM5A#IDRISIBMvargas 
    181181 
    182  Prochaine telco 6 ou 7 décembre à 14h. Prévoir point sur dods et datanode. 
     182== Notes telco jeudi 15 décembre 2011 == 
     183 
     184Participants : Gilles Wiber, Patrice Lucas, Thomas Leibovici, Kilian Cavalotti, Anne Cozic, Sébastien Denvil, Arnaud Caubel 
     185 
     186 * Maintenance des machines du 13 décembre 
     187  * Les problèmes suivants sont apparus au redémarrage des machines : 
     188   * mercure : variables d’environnement mal positionnées. Origine du pb : modifs effectuées sur  le "ccc_home". 
     189   * titane : un "cd ~" a été ajouté dans profile.local. 
     190   * Ces problèmes ont entrainé l’arrêt de la production IPSL sur mercure et titane jusqu’au 14 décembre après-midi. Tout semble rentré dans l’ordre. Ces pbs étaient dus à la situation exceptionnelle de fusion du CCRT et TGCC. 
     191    * CCRT : des tests sur les variables d’environnement seront ajoutés lors des procédures de check passées pour valider les maintenances. 
     192    * IPSL : necessité de fournir un bench type au CCRT à passer après chaque maintenance (et régulièrement ?) pour s’assurer d’une non régression de la chaîne. 
     193  * /home/cont003/p86caub devient /ccc/cont003/home/dsm/p86caub. 
     194   * A voir quelles permissions mettre sur les groupes dsm et genci*. 
     195   * Rappel des standards d’utilisation : un seul login par utilisateur imputé sur plusieurs groupes. 
     196 * Divers  
     197  * Arrêt mercure SX8 : arrêt de la production au 31/12/2011 mais délai de connexion de 3 mois. Plus de ménage sera fait par les anciens utilisateurs, plus d'espace sera dispo pour les utilisateurs actuels. 
     198  * Un seul login utilisateur sur Curie (et ailleurs !) : pour les utilisateurs qui  avaient un compte en avance (type preparatory access) le compte sera supprimé et les données transférés sur le seul compte de l’utilisateur sur demande. 
     199 * Migration des données 
     200  * Calendrier : 
     201    * Depuis fin nov 2011 : accès aux nouveaux espaces CCCWORKDIR et CCCSTOREDIR depuis les machines CCRT. Une indisponibilté prolongée du cccworkdir comme celle qui a eu lieu avant la maintenance ne se reproduira pas. 
     202    * 3 mois pour migrer la production et préparation d’archive (ccc_archive). 
     203    * Passage read-only : 
     204     * 7 fevrier : comptes dormants + utilisateurs volontauires 
     205     * Mars : dmnfs 1,2,3 et 13 
     206     * Avril : dmnfs 4 à 12 
     207    * Accès en read-only au dmnfs jusqu'à la fin des dmnfs (fin 2012 ?) 
     208  * Espace tampon : 
     209   * Deux espaces tampons à définir : 
     210    * Espace utilisé pour la migration : 4Po situé sur le storedir mais NON VISIBLE par l’utilisateur 
     211    * Espace utilisé pour le « pack » au cours de la production :  
     212     * Mercure : scratchdir (partagé entre climat SX9 et utilisateurs SX8), on part sur 20TB, devrait être suffisant. Possibilité de quota par groupe plutôt que par utilisateur ? Taille de scratch nécessaire  à affiner. STOREDIR = dernier recours car : 
     213      * Pas fait pour ça  
     214      * Montage NFS depuis mercure et titane 
     215     * Titane : scratchdir, devrait être suffisant. Projection IPSL à affiner. Dernier recours : STOREDIR 
     216     * Curie : scratchdir, quota à affiner, nombre de power-user 
     217   * Trouver une variable d’ajustement avec toutes ces contraintes :en fonction de la taille des fichiers requises,du  nombre de fichiers limité sur le Storedir, de la tailles de scratch nécessaire et disponible sur mercure et titane,… 
     218  * Le passage de titane vers curie pour l’IPSL sera progressif mais le début d’année 2012 se fera sur titane car la production sur curie nécessite :  
     219   * l’utilisation du pack dans la chaîne 
     220   * le portage des différents outils (compilation,soumission,…) et la validation des modèles  
     221  * Commande ccc_archive : 
     222   * Anne a remonté quelques soucis sur la version actuelle. Des tests vont être refaits.   
     223   * Le flag pour être "ipsl_packé" se fera via la commande ccc_archive. L’IPSL doit fournir ce qu’il faut intégrer dans le ccc_archive. A faire rapidement (idéalement avant les vacances, mi-janvier dernier délai). 
     224   * Recommander d’utiliser le fichier « à plat » du cscratchdir avant l’utilisation du ccc_archive 
     225   * Pas de limite (en nombre) d’archives demandées 
     226  * Paiement des heures Curie : IPSL pas d’accord. A estimer précisément les ressources nécessaires (8 CPUs sur 2/3 mois ?). A rediscuter. 
     227  * Cahier des charges :  
     228   * Calendrier : dépôt fin janvier pour début de prestation début mars.  
     229   * Toutes les parties listées dans le document sont pour une seule et même prestation. 
     230   * Jean-Noël Richet et Bruno Froge s’occupent de ça. 
     231  * Datanode : ouverture de filtrage OK, Dieter a avancé et voit avec Sébastien par mail pour continuer.   
     232  * Dods : pas abordé. 
     233 
     234Prochaine telco début janvier : doodle à lancer. 
     235