propositions de stages - cea - hpc
TRANSCRIPT
Di rect ion des appl icat ions mi l i ta i res Centre DAM Ă le de France
INFORMATIQUE DâENTREPRISE INFORMATIQUE SCIENTIFIQUE
SIMULATION NUMERIQUE SECURITE INFORMATIQUE
Date de diffusion : Septembre 2016
Commissariat Ă lâĂ©nergie atomique et aux Ă©nergies alternatives Centre DAM Ăle de France â DSSI/ED â BĂątiment CDC - BruyĂšres-le-ChĂątel â F- 91297 Arpajon Cedex
TĂ©l : (33) â 01 69 26 40 00 Ătablissement public Ă caractĂšre industriel et commercial
R. C..S. PARIS B 775 685 019
PROPOSITIONS DE STAGES 2017
AU CEA/DAM ILE DE FRANCE
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
TABLE DES MATIERES 1 Les stages proposĂ©s en un coup dâoeil ..................................................................................... 4
2 Le CEA .................................................................................................................................... 5
3 Le CEA/DAM .......................................................................................................................... 6
4 Le centre DAM - Ile de France ................................................................................................ 8
5 Le CAMPUS TERATEC ....................................................................................................... 10
6 Les activitĂ©s informatiques au CEA/DAM â Ile de France ................................................... 12
7 Sites utiles .............................................................................................................................. 12
8 Comment postuler pour un stage ? ......................................................................................... 12
9 Les thématiques des stages .................................................................................................... 13
10 Les stages en informatique dâentreprise ................................................................................ 14
11 Les stages en informatique scientifique ................................................................................. 18
12 Les stages en simulation numérique ...................................................................................... 27
13 Les stages en sécurité informatique ....................................................................................... 38
Page 3
Propositions de stages informatiques 2017 au CEA/DAM Ile de France 1 LES STAGES PROPOSES EN UN COUP DâOEIL
ThÚme Titre Référence Formation Durée
Recherche dâun outil du marchĂ© permettant la gestion de ressources partagĂ©es plus performant que les objets Exchange IE-17-01 Bac + 2 3 Ă 4
SCCM : suivi de parc informatique Windows (sécurité) IE-17-02 Bac + 4/5 4 à 6
SPLUNK : supervision des infrastructures systĂšmes IE-17-03 Bac + 4/5 4 Ă 6
Outils dâĂ©valuation Ă chaud de la satisfaction utilisateur IE-17-04 Bac + 4/5 4 Ă 6
Contribution à un logiciel de stockage de données distribué IS-17-01 Bac + 5 5 à 6
Traitement distribuĂ© de flux dâĂ©vĂšnements systĂšmes IS-17-02 Bac + 4/5 4 Ă 6
PrĂ©diction des accĂšs aux donnĂ©es en environnement HPC IS-17-03 Bac + 4/5 4 Ă 6 Etude et amĂ©lioration de lâinterface de visualisation de mĂ©triques Grafana IS-17-04 Bac + 4/5 4 Ă 6 Ătude et optimisation des bases de donnĂ©es distribuĂ©es Hadoop HBASE IS-17-05 Bac + 4/5 4 Ă 6
Etude de SaltStack, logiciel de gestion de configuration et DevOps IS-17-06 Bac + 4/5 4 Ă 6 Etat de lâart et Ă©valuation des solutions rĂ©seaux SDN (Software Defined Network) IS-17-07 Bac + 4/5 4 Ă 6 Etude et mise en Ćuvre dâun systĂšme de qualification de liaisons rĂ©seaux Ă base de composant de type Raspberry Pi IS-17-08 Bac + 4/5 4 Ă 6
Etude et amélioration du routage interne aux réseaux InfiniBand IS-17-09 Bac + 4/5 4 à 6
Evaluation de bibliothÚques I/O pour les codes de simulation numérique SN-17-01 Bac + 4/5 4 à 6
Optimisation au sein dâun coupleur de code basĂ©e sur lâapprentissage SN-17-02 Bac + 4/5 4 Ă 6
Algorithme de partitionnement de maillages sous contraintes mémoires SN-17-03 Bac + 5 5 à 6
Algorithme Cubecover pour le maillage SN-17-04 Bac +5 5 Ă 6
Polycubes pour la génération de maillages 3D SN-17-05 Bac + 5 5 à 6
Algorithme de submapping pour la génération de maillages 2D SN-17-06 Bac + 5 5 à 6
Analyse des performances de régions parallÚles OpenMP SN-17-07 Bac + 5 5 à 6 Analyse du placement des données en mémoire en relation avec un ordonnanceur de threads SN-17-08 Bac + 5 5 à 6
SchĂ©mas implicites dâordre trĂšs Ă©levĂ© pour la dynamique des gaz SN-17-09 Bac + 5 5 Ă 6 OpĂ©rateur de diffusion vectoriel pour lâhydrodynamique lagrangienne turbulente sur maillage dĂ©formĂ© SN-17-10 Bac + 5 5 Ă 6
Maximisation du potentiel dâasynchronisme dans un code MPI SN-17-11 Bac + 5 5 Ă 6
R&D autour de la cartographie réseau SI-17-01 Bac + 5 3 à 6
DĂ©-obscurcissement de JavaScript SI-17-02 Bac + 5 5 Ă 6
Reconnaissance automatique de fonctions par effets de bord SI-17-03 Bac + 4 3 Techniques de fuzzing et d'audit de code appliquées à l'évaluation de la sécurité de systÚmes de fichiers réseau SI-17-04 Bac + 5 5 à 6 Technique de reverse engineering de protocole réseaux propriétaires par émulation de binaires et data slicing SI-17-05 Bac + 5 5 à 6
Page 4
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
2 LE CEA
Acteur majeur de la recherche, du dĂ©veloppement et de l'innovation, le Commissariat Ă lâĂ©nergie atomique et aux Ă©nergies alternatives intervient dans cadre de quatre missions :
⹠la défense et la sécurité ;
âą lâĂ©nergie nuclĂ©aire (fission et fusion) ;
âą la recherche technologique pour lâindustrie ;
âą la recherche fondamentale (sciences de la matiĂšre et sciences de la vie).
Sâappuyant sur une capacitĂ© dâexpertise reconnue, le CEA participe Ă la mise en place de projets de collaboration avec de nombreux partenaires acadĂ©miques et industriels.
Le CEA est implantĂ© sur 10 centres rĂ©partis dans toute la France. Il dĂ©veloppe de nombreux partenariats avec les autres organismes de recherche, les collectivitĂ©s locales et les universitĂ©s. A ce titre, le CEA est partie prenante des alliances nationales coordonnant la recherche française dans les domaines de lâĂ©nergie (ANCRE), des sciences de la vie et de la santĂ© (AVIESAN), des sciences et technologies du numĂ©rique (ALLISTENE), des sciences de lâenvironnement (ALIEnv) et des sciences humaines et sociales (ATHENA).
Reconnu comme un expert dans ses domaines de compétence, le CEA est pleinement inséré dans l'espace européen de la recherche et exerce une présence croissante au niveau international.
Le CEA compte 15 958 techniciens, ingénieurs, chercheurs et collaborateurs pour un budget de 4,1 milliards d'euros (chiffres publiés fin 2015).
ORGANIGRAMME DU CEA
Page 5
Propositions de stages informatiques 2017 au CEA/DAM Ile de France 3 LE CEA/DAM
Une direction au service de la dissuasion La Direction des applications militaires (DAM) du CEA, a pour mission de concevoir, fabriquer, maintenir en condition opĂ©rationnelle, puis dĂ©manteler les tĂȘtes nuclĂ©aires qui Ă©quipent les forces nuclĂ©aires aĂ©roportĂ©e et ocĂ©anique françaises. La DAM est chargĂ©e de la conception et de la rĂ©alisation des rĂ©acteurs et de cĆurs nuclĂ©aires Ă©quipant les bĂątiments de la Marine nationale, sous-marins et porte-avions. Elle apporte son soutien Ă la Marine nationale pour le suivi en service et le maintien en condition opĂ©rationnelle de ces rĂ©acteurs. La DAM est Ă©galement responsable de l'approvisionnement des matiĂšres nuclĂ©aires stratĂ©giques pour les besoins de la dissuasion. Dans un monde en profonde mutation, la DAM contribue aussi Ă la sĂ©curitĂ© nationale et internationale Ă travers lâappui technique quâelle apporte aux autoritĂ©s, pour les questions de lutte contre la prolifĂ©ration nuclĂ©aire et le terrorisme et de dĂ©sarmement. Depuis le transfert du centre de Gramat en 2010 de la Direction gĂ©nĂ©rale de lâarmement au CEA, la DAM apporte son expertise Ă la DĂ©fense dans le domaine de lâarmement conventionnel. Une direction ouverte Ă la recherche Le partage national et international des connaissances (lorsquâil est possible), la confrontation Ă lâĂ©valuation scientifique extĂ©rieure, lâintĂ©gration Ă des rĂ©seaux de compĂ©tences constituent des gages de crĂ©dibilitĂ© scientifique. Les Ă©quipes de la DAM rĂ©alisent chaque annĂ©e environ 2000 publications et communications scientifiques. Cette ouverture de la DAM passe Ă©galement par la mise Ă la disposition de la communautĂ© des chercheurs de ses moyens expĂ©rimentaux et par la contribution de ses Ă©quipes Ă dâautres programmes de recherche. Une direction actrice de la politique industrielle française La DAM partage trĂšs largement son activitĂ© avec lâindustrie française : câest ainsi que le montant des achats, auprĂšs de celle-ci, reprĂ©sente plus des deux tiers de son budget ; le dernier tiers se rĂ©partit entre les salaires des personnels (un cinquiĂšme) et les taxes. La politique industrielle de la DAM est originale Ă plus dâun titre :
âą dâabord parce que la DAM conserve la maĂźtrise dâĆuvre dâensemble de la grande majoritĂ© des systĂšmes dont elle a la responsabilitĂ© : elle veille ainsi au juste Ă©quilibre entre les grands groupes industriels de la DĂ©fense et les PME souvent innovantes, en contractualisant directement avec ces derniĂšres, leur permettant ainsi de recevoir la juste rĂ©munĂ©ration de leur production ;
âą ensuite, parce que la rĂ©partition de son budget est sous-tendue par une rĂ©partition des travaux : la DAM conduit la recherche dans ses laboratoires grĂące Ă son personnel de haut niveau scientifique et technologique. Une fois la dĂ©finition dâun produit acquise, la DAM transfĂšre la dĂ©finition et les procĂ©dĂ©s vers les industriels qui en rĂ©alisent le dĂ©veloppement, puis la production.
La DAM a Ă©galement pour objectif que ses centres participent Ă la vie Ă©conomique locale par leur implication dans les pĂŽles de compĂ©titivitĂ©. Hors de son propre champ dâutilisation, elle valorise ses recherches par le transfert de technologies vers lâindustrie et le dĂ©pĂŽt de nombreux brevets.
Page 6
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Le format La DAM comprend cinq centres aux missions homogÚnes, dont les activités se répartissent entre la recherche de base, le développement et la fabrication :
âą DAM Ile-de-France (DIF), Ă BruyĂšres-le-ChĂątel, oĂč sont menĂ©s les travaux de physique des armes, les activitĂ©s de simulation numĂ©rique et de lutte contre la prolifĂ©ration nuclĂ©aire ; DIF est aussi le centre responsable de lâingĂ©nierie Ă la DAM ; enfin, au centre DIF est rattachĂ©e lâINBS-Propulsion NuclĂ©aire du centre CEA/Cadarache, en rĂ©gion Provence Alpes-CĂŽte dâAzur, oĂč sont implantĂ©es les installations d'essais Ă terre et une partie des fabrications de la propulsion nuclĂ©aire ;
âą Le Cesta, en Aquitaine, consacrĂ© Ă lâarchitecture des
armes, aux tests de tenue Ă lâenvironnement. Il met en Ćuvre le Laser MĂ©gajoule, Ă©quipement majeur de la Simulation ;
âą Valduc, en Bourgogne, dĂ©diĂ© aux matĂ©riaux nuclĂ©aires et Ă
lâinstallation expĂ©rimentale Epure du programme Simulation ;
⹠Le Ripault, en région Centre, dédié aux matériaux non
nuclĂ©aires (explosifs chimiquesâŠ) ;
⹠Gramat, (ex-DGA) en Midi-Pyrénées, qui conduit au profit de la Défense des activités en vulnérabilité des systÚmes et efficacité des armements.
Centre DAM Ăle-de-France
Page 7
Propositions de stages informatiques 2017 au CEA/DAM Ile de France 4 LE CENTRE DAM - ILE DE FRANCE
Le CEA/DAM - Ăle de France (DIF) est l'une des directions opĂ©rationnelles de la DAM.
Le site de la DIF compte environ 2000 salariés CEA et accueille quotidiennement environ 600 salariés d'entreprises extérieures. il est situé à BruyÚres-le-Chùtel à environ 40 km au sud de Paris, dans l'Essonne.
Les missions de la DIF comprennent :
⹠la conception et garantie des armes nucléaires, grùce au programme Simulation. L'enjeu consiste à reproduire par le calcul les différentes phases du fonctionnement d'une arme nucléaire et à confronter ces résultats aux mesures des tirs nucléaires passés et aux résultats expérimentaux obtenus sur les installations actuelles (machine radiographique, lasers de puissance, accélérateurs de particules) ;
âą la lutte contre la prolifĂ©ration et le terrorisme, en contribuant notamment au programme de garantie du TraitĂ© de Non ProlifĂ©ration et en assurant l'expertise technique française pour la mise en Ćuvre du TraitĂ© d'Interdiction ComplĂšte des Essais NuclĂ©aires (TICE) ;
⹠l'expertise scientifique et technique, dans le cadre de la construction et du démantÚlement d'ouvrages complexes ainsi que pour la surveillance de l'environnement et les sciences de la terre ;
⹠l'alerte des autorités, mission opérationnelle assurée 24h sur 24, 365 jours par an, en cas d'essai nucléaire, de séisme en France ou à l'étranger, et de tsunami dans la zone Euro-méditerranéenne. La DIF fournit aux autorités les analyses et synthÚses techniques associées.
Depuis 2003, le centre DAM-Ăle-de-France hĂ©berge le complexe de calcul scientifique du CEA, qui regroupe lâensemble des supercalculateurs du CEA, et qui comprend :
âą le supercalculateur Tera1000-1 pour les besoins du programme Simulation du CEA/DAM, mis en service en 2016, dispose dâune puissance de calcul de 2,5 petaflops, câest Ă dire capable dâeffectuer 2,5 millions de milliards dâopĂ©rations par seconde Il sera complĂ©tĂ© en 2017 par Tera1000-2, autre composante du projet Tera1000, qui prĂ©figure les architectures et technologies du futur supercalculateur qui sera installĂ© Ă lâhorizon 2020.
Super Calculateur Tera1000-1
Page 8
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
âą Les ordinateurs du Centre de Calcul pour la Recherche et la Technologie (CCRT), ouverts Ă la
communautĂ© civile de la recherche et de lâindustrie, pour une puissance globale de 1,5 petaflops ;
Supercalculateur Airain
âą le supercalculateur Curie, dâune puissance de 2 petaflops, deuxiĂšme Ă©lĂ©ment dâun rĂ©seau de
supercalculateurs de classe petaflopique destiné aux chercheurs de la communauté scientifique européenne. Ce supercalculateur est hébergé au TGCC (TrÚs Grand Centre de Calcul) et exploité par les équipes du CEA, qui apporte ainsi sa contribution à la participation de la France au projet PRACE (Partnership for Advanced Computing in Europe).
Supercalculateur Curie
Page 9
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
5 LE CAMPUS TERATEC La plupart des stages proposĂ©s se dĂ©roulent dans les locaux du campus Ter@tec. Les autres se dĂ©roulent dans les locaux situĂ©s Ă lâintĂ©rieur du site CEA.
Le Campus TERATEC est lâune des deux composantes de la Technopole TERATEC, lâautre composante Ă©tant le « TrĂšs Grand Centre de Calcul du CEA » (TGCC).
Cette technopole, a Ă©tĂ© crĂ©Ă©e Ă lâinitiative du CEA afin de dĂ©velopper et promouvoir la simulation numĂ©rique haute performance, Ă proximitĂ© du site du CEA, sur la commune de BruyĂšres-le-ChĂątel, dans le dĂ©partement de lâEssonne.
Une cantine « inter-entreprises » est accessible à tous les stagiaires.
LâaccĂšs principal Ă la Technopole TERATEC se fait par une entrĂ©e commune au TGCC et au Campus, situĂ©e au nord-ouest, sur le chemin de la Piquetterie.
LâOpenspace pour les stagiaires
Page 10
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Le CEA a mis en place un rĂ©seau spĂ©cifique de cars qui dessert Paris et de nombreuses communes de la rĂ©gion parisienne. Par ailleurs, le campus Ter@tec est desservi par la ligne de transport en commun 91-04, entre la gare routiĂšre dâEvry et la gare autoroutiĂšre de Briis-sous-Forges.
Page 11
Propositions de stages informatiques 2017 au CEA/DAM Ile de France 6 LES ACTIVITES INFORMATIQUES AU CEA/DAM â ILE DE FRANCE
Le systĂšme dâinformation (SI) de la DAM est constituĂ© de 4 sous-systĂšmes : entreprise, technique, industriel et scientifique, concernant respectivement :
âą les aspects budget, ressources humaines, logistique, sĂ©curitĂ© des personnes et des biens, patrimoine âŠ
âą les activitĂ©s « Programme » de la DAM : bureau dâĂ©tudes, mĂ©thodes, calcul, fabrication, qualitĂ© des produits fabriquĂ©s, gestion des matiĂšres âŠ
âą les procĂ©dĂ©s industriels : acquisition mesures, systĂšme de supervision, surveillance, commande contrĂŽle, contrĂŽle des utilitĂ©s, accĂšs, autocom tĂ©lĂ©com âŠ
âą le domaine scientifique associant la simulation avec le calcul haute performance.
Les activitĂ©s dĂ©clinĂ©es dans ces systĂšmes dâinformation dans lesquelles sâinscrivent les stages proposĂ©s, sont les suivantes :
âą Ă©tude, conception et rĂ©alisation du systĂšme dâinformation du CEA/DAM ; âą dĂ©finition, conception, dĂ©ploiement et exploitation des rĂ©seaux et des serveurs ; âą Ă©tude, conception, dĂ©veloppement et maintenance de codes et outils de simulation
numĂ©rique et dâenvironnement logiciel dans le domaine du calcul haute performance ; âą Ă©tude, conception, dĂ©veloppement de systĂšmes informatiques dans le domaine du calcul
haute performance ; Auxquelles deux activités transverses sont ajoutées :
⹠expertise et activités opérationnelles dans le domaine de la sécurité informatique ; ⹠animation scientifique dans le domaine du calcul scientifique haute performance.
7 SITES UTILES Pour plus dâinformations, vous pouvez consulter les sites suivants : http://www.cea.fr http://www-hpc.cea.fr/ http://www.teratec.eu/ Retrouvez tous les stages proposĂ©s par le CEA sur le site : http://portail.cea.fr/emploi/Pages/stages/les-stages.aspx
8 COMMENT POSTULER POUR UN STAGE ? Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00. Nous attirons lâattention des candidats sur le fait que les dĂ©lais dâinstruction des dossiers de candidature sont de 2 mois, sauf pour les thĂ©matiques « Informatique dâentreprise » et « sĂ©curitĂ© informatique » pour lesquels le dĂ©lai est de 4 mois.
Page 12
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
9 LES THEMATIQUES DES STAGES
Les stages proposĂ©s se dĂ©clinent dans les 4 thĂ©matiques suivantes : Informatique dâentreprise : serveurs bureautiques et applicatifs, applications de gestion, postes de travail, bases de donnĂ©es, Intranet ; Informatique scientifique, Calcul Haute Performance (HPC) et rĂ©seaux : grands calculateurs Ă vocation scientifique, High Performance Computing, stockage haute performance, logiciels « systĂšme », Linux, rĂ©seaux dâentreprise, interconnexion des calculateurs ; Simulation numĂ©rique : dĂ©veloppement de logiciels scientifiques, IHM, visualisation, gestion de donnĂ©es, prĂ© et post-traitement ; SĂ©curitĂ© informatique : dĂ©veloppement dâoutils logiciels.
Supercalculateur Tera 100
Page 13
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
10 LES STAGES EN INFORMATIQUE DâENTREPRISE
Titre
Recherche dâun outil du marchĂ© permettant la gestion de ressources partagĂ©es plus performant que les objets Exchange
Référence IE-17-01
Contexte
Sur le rĂ©seau dâentreprise, diffĂ©rentes ressources peuvent ĂȘtre partagĂ©es et donc rĂ©servĂ©es selon des processus diffĂ©rents. On peut citer les ressources salles de rĂ©union, matĂ©riel de prĂȘt, vĂ©hicules⊠par exemple.
Ce rĂ©seau dispose dâun outil largement dĂ©ployĂ© grĂące Ă la messagerie, mais les Ă©lĂ©ments de description y figurant ne sont pas suffisants. Un outil obsolĂšte (URBA) a Ă©tĂ© mis en place dans 2 centres sur 5 au CEA/DAM. Bien utilisĂ© il convient dâen recueillir le retour dâexpĂ©rience et le pĂ©rimĂštre couvert.
Objectifs
Il sâagit de rĂ©aliser :
- Recenser les usages actuels et les besoins exprimés (demandes et
expériences) - Rédiger un comparatif fonctionnel et technique des produits du
marchĂ© et dâen analyser les possibilitĂ©s dâintĂ©gration dans notre rĂ©seau dâentreprise.
Domaines de spĂ©cialitĂ© requis Application dâinformatique dâentreprise
Langages/logiciels Windows
Mots clés
Gestion de ressources
Formation recherchée BAC+2
Durée du stage 3 à 4 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 14
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
SCCM : suivi de parc informatique Windows (sécurité)
Référence IE-17-02
Contexte
System Center Configuration Manager est un logiciel Microsoft utilisĂ© par le CEA pour gĂ©rer son parc dâordinateurs sur systĂšmes Windows. Il permet la prise de main Ă distance, la gestion de correctifs, lâautomatisation de tĂąches, la tĂ©lĂ©distribution dâapplications, lâinventaire matĂ©riel et logiciel, la gestion de la conformitĂ© et lâadministration des politiques de sĂ©curitĂ©.
Lâobjet du stage est dâexplorer les possibilitĂ©s de configurer des tableaux de bord et des rapports sous SCCM pour rĂ©pondre aux besoins de suivi de parc (inventaire, sĂ©curitĂ©)
Objectifs
Les objectifs de ce stage sont :
⹠Etude des possibilités de SCCM (dashboard, reports), ⹠Recensement des besoins CEA en termes de suivi du niveau de
sécurité de son parc, ⹠Développement et configuration de SCCM, ⹠Présentation des états du parc.
Domaines de spécialité requis administration systÚme, sécurité, poste de travail, Windows, SCCM
Langages/logiciels SystÚme Windows, SCCM, Patch Management Mots clés Windows, SCCM, Par Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 15
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre SPLUNK : supervision des infrastructures systĂšmes
Référence IE-17-03
Contexte
Splunk est un logiciel de collecte et d'analyse de données orienté "big
data", accessibles via une interface web.
Splunk indexe en temps réel des données issues de machines (logs, web
services, configurations, équipements télécom, GPS, capteurs,...). Le
CEA lâutilise pour la supervision de ses infrastructures systĂšmes.
Objectifs
Les objectifs de ce stage sont :
⹠Etudier les possibilités de Splunk et sa configuration actuelle au CEA, ⹠Analyser les possibilités de supervision de nouveaux éléments
dâinfrastructures (NetApp ou autre), âą Mettre en place les remontĂ©es de ces nouveaux domaines dans
Splunk, ⹠Présentation de la supervision des nouveaux éléments mis en place.
Domaines de spécialité requis administration systÚme, logs systÚmes, big data, Windows, Linux
Langages/logiciels Splunk, Windows Mots clés Splunk, big data, Windows, Linux Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 16
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Outils dâĂ©valuation Ă chaud de la satisfaction utilisateur
Référence IE-17-04
Contexte
Comme de nombreuses entreprises, le CEA/DAM a besoin de mesurer la satisfaction de ses utilisateurs quant au service rendu sur son systĂšme dâinformation. Une premiĂšre dĂ©marche a Ă©tĂ© initiĂ©e dans ce sens et les outils mis en place doivent ĂȘtre enrichis et dĂ©veloppĂ©s pour mesurer des critĂšres supplĂ©mentaires.
Objectifs
Les objectifs de ce stage sont :
âą DĂ©couvrir les outils actuels et le fonctionnement du support des
services informatiques (ITIL), âą Identifier les axes essentiels Ă mesurer en termes de satisfaction
utilisateur (interview, ITIL) et proposer les éléments à mesurer, ⹠Etudier les outils utilisables pour réaliser ces mesures (Open Source
ou Site Web), âą Prototyper ces outils et rĂ©aliser une premiĂšre enquĂȘte partielle et la
dépouiller.
Domaines de spécialité requis ITIL, Gestion des services, Satisfaction utilisateur
Langages/logiciels OpenSource, applications web, bases de données Mots clés ITIL, Open Source, Web Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 17
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
11 LES STAGES EN INFORMATIQUE SCIENTIFIQUE
Titre
Contribution à un logiciel de stockage de données distribué
Référence IS-17-01
Contexte
R&D du laboratoire en matiÚre de stockage massif de données en environnement HPC.
Les supercalculateurs du CEA produisent d'immenses quantitĂ©s de donnĂ©es (dizaines de PĂ©taOctets) Ă des dĂ©bits extrĂȘmes (centaines de GigaOctets par seconde). Pour stocker ces donnĂ©es de maniĂšre robuste et performante, le CEA dĂ©veloppe un logiciel de stockage de donnĂ©es parallĂšle et distribuĂ©.
Le stagiaire apportera sa contribution à un logiciel de stockage de données haute-performance développé par le CEA.
Objectifs
Ce stage consistera à contribuer au développement de fonctionnalités sur ce logiciel porté sur ce systÚme de stockage :
âą la gestion des donnĂ©es sur diffĂ©rents types de mĂ©dias (flash, ssd, disques, bandes, stockage objetâŠ),
âą le contrĂŽle des accĂšs distants (sĂ©curitĂ©), âą la mise en Ćuvre dâalgorithmes de sĂ©lection optimale de pĂ©riphĂ©-
riques (optimisation des temps d'accĂšs),
Domaines de spécialité requis
Programmation en C, base de données, programmation systÚme, programmation distribuée.
Langages/logiciels C, C++, Python, administration Linux Mots clés Stockage, stockage objet, programmation distribuée, développement logiciel Formation recherchée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thÚse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 18
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Traitement distribuĂ© de flux dâĂ©vĂšnements systĂšmes
Référence IS-17-02
Contexte
R&D du laboratoire en matiÚre de stockage de données massif en environnement HPC.
Les supercalculateurs du CEA effectuent chaque seconde des centaines de milliers d'opérations sur les données. Ces événements (créations de fichiers, écritures...) sont remontés à un service (PolicyEngine) qui permet la gestion massive des données et le maintien des statistiques d'accÚs. Ce service utilise une base de données.
Objectifs
L'objectif est de :
âą dĂ©velopper un mĂ©canisme de distribution de l'information entre plu-sieurs serveurs de base de donnĂ©es, en mettant en Ćuvre une technique de « sharding ».
Cette technique permet de décupler la capacité de traitement d'un systÚme de base de données en agrégeant la capacité de traitement de plusieurs serveurs.
Domaines de spécialité requis Programmation en C, base de données, Langage SQL
Langages/logiciels C, C++, bash, administration Linux, SQL, git
Mots clés Stockage, Base de données, MariaDB / MysQL, PostgreSQL, Développe-ment logiciel, Sharding, Open Source
Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 19
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Prédiction des accÚs aux données en environnement HPC
Référence IS-17-03
Contexte
R&D du laboratoire en matiÚre de stockage massif de données en environnement HPC
Objectifs
Le stage consiste Ă mettre en Ćuvre des algorithmes de «Machine Lear-ning» afin de prĂ©dire le comportement des accĂšs aux donnĂ©es sur un super-calculateur par diffĂ©rents codes de calcul, le but Ă©tant d'optimiser le place-ment de ces donnĂ©es dans les diffĂ©rents niveaux de mĂ©moire et de stock-age.
A partir des événements observés d'accÚs aux données, le stagiaire devra :
âą proposer et mettre en Ćuvre une solution logicielle capable de dĂ©-tecter des motifs rĂ©currents d'accĂšs Ă certaines donnĂ©es,
⹠prédire les potentiels futurs accÚs.
Domaines de spécialité requis
Programmation en C, programmation systÚme, rudiments en « machine learning »
Langages/logiciels C, C++, Python, administration Linux, bash, java, git, spark/flink Mots clés Stockage,cluster, machine learning, développement logiciel Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 20
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Etude et amĂ©lioration de lâinterface de visualisation de mĂ©triques Grafana
Référence IS-17-04
Contexte
Dans le cadre de ses activitĂ©s de calcul haute performance (HPC), le CEA met en Ćuvre et exploite des infrastructures techniques capables de suivre en temps rĂ©el l'utilisation des ressources de calcul et de stockage mises Ă la disposition de ses utilisateurs. Ces infrastructures, reposant sur des outils issus de la sphĂšre "BigData", mettent en Ćuvre des produits open source comme OpenTSDB, HBASE et Grafana.
Objectifs
Le premier objectif de ce stage sera de se familiariser :
âą avec les principes de fonctionnement d'une solution de collecte de
métriques basée sur les outils HBASE et OpenTSDB, ⹠sur le fonctionnement d'un supercalculateur.
Dans un second temps, l'objectif du stage consistera en :
⹠l'étude et l'amélioration de l'outil web de visualisation Grafana couplé
à une source de données OpenTSDB, ⹠la définition de nouvelles interfaces de visualisation complémentaires
pour l'aide aux traitements avancés des informations collectées.
Domaines de spécialité requis Informatique (Linux)
Langages/logiciels HTML, JavaScript, Java, Grafana, ElasticSearch, OpenTSDB, DC.js, D3.js, Bootstrap.js
Mots clés Grafana OpenTSDB HPC BIGDATA Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 21
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Ătude et optimisation des bases de donnĂ©es
distribuées Hadoop HBASE
Référence IS-17-05
Contexte
Dans le cadre de ses activitĂ©s de calcul haute performance (HPC), le CEA met en Ćuvre et exploite des infrastructures techniques capables de suivre en temps rĂ©el l'utilisation des ressources de calcul et de stockage mises Ă la disposition de ses utilisateurs. Ces infrastructures, reposant sur des outils issus de la sphĂšre « BigData », nĂ©cessitent un paramĂ©trage fin et adaptĂ© aux exigences des besoins qu'elles doivent satisfaire.
Objectifs
Le premier objectif de ce stage est :
⹠d'étudier les principes de fonctionnement en mode distribué de la
base de données Hadoop HBASE et du systÚme de fichiers HDFS sur lequel elle repose.
Dans un second temps, le stagiaire mĂšnera :
âą lâĂ©tude d'une architecture de collecte de statistiques mises en Ćuvre
sur les calculateurs du CEA, ce qui permettra de se familiariser avec un cas d'utilisation concret d'une base de données HBASE.
⹠des campagnes de paramétrage et d'optimisation de HBASE sur une infrastructure de test afin de rechercher les configurations les plus adaptées à une utilisation performante et robuste pour ce cas d'utilisation.
Domaines de spécialité requis Informatique (Linux)
Langages/logiciels Java, Shell scripting, JRuby, HBASE, HDFS, OpenTSDB Mots clés Hadoop HBASE OpenTSDB HPC BIGDATA Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 22
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Etude de SaltStack, logiciel de gestion de configuration
et DevOps
Référence IS-17-06
Contexte
Le CEA/DAM gĂšre des clusters composĂ©s de plusieurs milliers de serveurs pour le calcul haute performance. La gestion de ces machines et de l'envi-ronnement associĂ© nĂ©cessite une infrastructure solide et performante afin de les configurer. Les logiciels libres sont au cĆur de l'infrastructure qui pilote ces machines, le CEA/DAM y contribue et en dĂ©veloppe.
SaltStack est un logiciel open-source de gestion de configuration en Python. Nouvel arrivant dans le monde des logiciels de gestion d'infrastructure, il se présente comme trÚs performant et optimisé pour le passage à l'échelle.
Objectifs
Le stage consiste Ă :
⹠étudier ce nouveau produit Salt Stack, ses caractéristiques, ses
performances, âŠetc. âą le comparer avec l'infrastructure actuelle utilisant Puppet
(benchmark), âą mettre en place une maquette.
http://www.saltstack.com/ http://www.puppetlabs.com/ http://www-hpc.cea.fr/ https://github.com/cea-hpc/
Domaines de spécialité requis Informatique (Linux)
Langages/logiciels Python / Linux Mots clés logiciel open source, administration, linux, cluster Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 23
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Etat de lâart et Ă©valuation des solutions rĂ©seaux SDN (Software Defined Network)
Référence IS-17-07
Contexte
La technologie SDN (Software Defined Network) fait lâobjet de nombreuses publications et Ă©tudes. Elle est prĂ©sentĂ©e comme Ă©tant une rĂ©volution dans le domaine des rĂ©seaux.
Les constructeurs réseaux proposent désormais dans leur gamme de produits des équipements compatibles avec le protocole OpenFlow.
Objectifs
Les objectifs sont : âą lâidentification et lâĂ©tude des solutions SDN aujourdâhui disponibles
et dâen effectuer une synthĂšse prĂ©sentant : - Leur mode de fonctionnement en se focalisant principalement sur
le rÎle du contrÎleur et sur le protocole OpenFlow, - Leurs points forts/faibles, - Leur maturité.
âą LâĂ©valuation des solutions les plus pertinentes, sachant que par
défaut, la solution HPE est déjà retenue,
Pour chaque solution, une maquette composĂ©e dâun contrĂŽleur et de plusieurs commutateurs est Ă dĂ©ployer. LâĂ©valuation de chaque solution doit permettre de mettre en Ă©vidence :
- La simplification apportée dans la programmation des
périphériques réseau - La possibilité de changer dynamiquement la configuration du
réseau
⹠Etude du protocole OpenFow, cela concerne la sécurité.
Domaines de spĂ©cialitĂ© requis RĂ©seau, Routage â commutation, Linux
Langages/logiciels Script Shell, Python Mots clés OpenFlow, Switch, SDN, Linux Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse
non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 24
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Etude et mise en Ćuvre dâun systĂšme de qualification de liaisons rĂ©seaux Ă base de composant de type Raspberry Pi
Référence IS-17-08
Contexte
Le systĂšme dâinterconnexion des sites de la Direction des Applications Miliaires (DAM) du CEA sâappuie sur des liaisons tĂ©lĂ©coms louĂ©es auprĂšs dâun opĂ©rateur français.
La vérification des performances de ces liaisons doit permettre de garantir aux utilisateurs une utilisation optimale des ressources disponible.
Objectifs
Lâobjectif est de proposer une solution permettant de qualifier des liaisons inter-centres de type WAN en mesurant diffĂ©rents critĂšres rĂ©seaux comme :
- La gigue - La latence - Le débit - Le taux de perte de paquets - Toute autre mesure jugée utile
Le comportement du rĂ©seau en fonction de la taille des paquets est Ă©galement Ă prendre en compte. Lâarchitecture de base envisagĂ©e se compose dâun serveur sur le site central et de modules dĂ©portĂ©s de type Raspberry Pi sur les centres distants. Ces Ă©quipements sont raccordĂ©s aux routeurs WAN prĂ©sents sur chaque centre. Les flux gĂ©nĂ©rĂ©s entre le serveur central et les modules dĂ©portĂ©s doivent permettre de qualifier les liaisons rĂ©seaux Ă la demande ou sur planification. LâĂ©tude doit :
- Identifier les outils et logiciels les mieux adaptĂ©s. - Valider lâadĂ©quation de modules de type Raspberry Pi pour ce
besoin, identifier les cas limites. - Intégrer ces éléments afin de concevoir une solution « user-
friendly » fiable et sĂ©curisĂ©e. La mise en Ćuvre de la solution dans le cadre dâun POC (Proof Of Concept) doit permettre sa qualification finale.
Domaines de spécialité requis Réseau, Linux, TCP/IP
Langages/logiciels Script Shell, logiciels de génération de trafic Mots clés Raspberry, WAN, Réseau, Linux Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse
non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 25
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre Etude et amélioration du routage interne aux réseaux InfiniBand Référence IS-17-09
Contexte
La technologie InfiniBand est utilisĂ©e sur les rĂ©seaux dâinterconnexion internes aux clusters de calculs du CEA.
Les topologies utilisĂ©es sont traditionnellement de type FatTree, ou Clos. Elles ont la particularitĂ© d'ĂȘtre en thĂ©orie non bloquantes, car un chemin peut ĂȘtre trouvĂ© pour chaque communication de maniĂšre indĂ©pendante.
Cependant, il apparaĂźt que les topologies logiques sont relativement figĂ©es et ne permettent pas de profiter pleinement des multiples chemins prĂ©sents, et par consĂ©quent, peuvent ĂȘtre sujettes Ă congestion. De plus les problĂ©matiques liĂ©es au type de nĆud, au positionnement des jobs ainsi quâĂ la fragmentation de la machine ne sont pas pris en compte.
Objectifs
Dans ce contexte, aprÚs une premiÚre introduction au fonctionnement du protocole InfiniBand, de ses spécificités ainsi que de la configuration du Subnet Manager (OpenSM), les objectifs du stage sont :
âą l'Ă©tude et la comparaison des derniĂšres versions des algorithmes
de routage, âą lâĂ©tude des nouvelles implĂ©mentations de Subnet Manager
(Mellanox SM, Fabric Scale, Obsidian BGFC).
L'amĂ©lioration des algorithmes de routage ou leur implĂ©mentation a fait lâobjet de nombreuses publications. Le candidat pourra :
âą les Ă©valuer sur des topologies de test grĂące Ă des outils de
simulation comme Ibsim, âą proposer de nouvelles.
Le candidat devra faire preuve de curiositĂ© intellectuelle et de rigueur. Domaines de spĂ©cialitĂ© requis RĂ©seau, Routage â commutation
Langages/logiciels Python, C, C++, OpenSM, IbSim, OFED
Mots clés Réseau, Infiniband, Mathématiques, Algorithmique distribuée, Informatique, Programmation
Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse
non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 26
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
12 LES STAGES EN SIMULATION NUMERIQUE
Titre
Evaluation de bibliothĂšques I/O pour les codes de simulation
numérique
Référence SN-17-01
Contexte
Le CEA, acteur majeur en matiĂšre de recherche et dâinnovation, est reconnu comme un expert du domaine HPC grĂące Ă lâimpulsion du « Programme Simulation ». Le CEA/DAM a la responsabilitĂ© de moyens de calcul HPC, dont la premiĂšre machine pĂ©taflopique française Curie. Les caractĂ©ristiques extrĂȘmes des architectures massivement parallĂšles et les particularitĂ©s des centres dâexploitation conduisent Ă porter une attention particuliĂšre Ă lâefficacitĂ© du traitement des gros volumes de donnĂ©es gĂ©nĂ©rĂ©s par les codes de calcul. Dans ce contexte, le CEA/DAM sâintĂ©resse particuliĂšrement aux bibliothĂšques dĂ©diĂ©es aux entrĂ©es/sorties (I/O).
Objectifs
Lâobjectif du stage est :
âą dâĂ©valuer des bibliothĂšques I/O (/1/, /2/) selon des critĂšres Ă©tablis en termes de coĂ»ts dâutilisation (charge mĂ©moire, performance de lecture et dâĂ©criture) et dâefficacitĂ© du parallĂ©lisme.
âą Ces bibliothĂšques seront comparĂ©es Ă une bibliothĂšque I/O dĂ©veloppĂ©e au CEA. Ces comparaisons se feront dans le contexte du couplage des bibliothĂšques Ă un code de simulation dâaĂ©rodynamique, plus particuliĂšrement en situation de « Protections/Reprises » et gestion des rĂ©sultats de calcul pour analyse et visualisation.
/1/ ADIOS (OAK RIDGE NATIONAL LABORATORY) /2/ SIONlib ( Forschungszentrum JĂŒlich)
Domaines de spécialité requis Informatique scientifique, logiciel de simulation, optimisation
Langages/logiciels C, C++ Mots clés I/O libraries, HDF5, NetCDF Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thĂšse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 27
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre Optimisation au sein dâun coupleur de code basĂ©e sur lâapprentissage
Référence SN-17-02
Contexte
Le CEA, acteur majeur en matiĂšre de recherche et dâinnovation, est reconnu comme un expert du domaine HPC grĂące Ă lâimpulsion du « Programme Simulation ». Le CEA/DAM a la responsabilitĂ© de moyens de calcul HPC, dont la premiĂšre machine pĂ©taflopique française Curie. Le CEA/DAM dĂ©veloppe des codes de simulation numĂ©rique qui manipulent des grandeurs sur des maillages. Ces donnĂ©es sont traitĂ©es par des codes de diagnostic, des routines de filtrage, dâanalyse ou reprĂ©sentĂ©es par des outils de visualisation. PaDaWAn est un logiciel de type intergiciel (middleware) dĂ©veloppĂ© au CEA/DAM qui permet le couplage de ces traitements avec des codes de calculs.
Objectifs
Lâobjectif de ce stage est :
âą dâexplorer les mĂ©thodes dâapprentissage pour la prise de dĂ©cision au sein dâun intergiciel (middleware) de calcul haute performance [1]. Dans le cadre du couplage, par exemple, lâoutil anticipera les rythmes de production et de consommation de donnĂ©es des diffĂ©rents codes. Ces informations serviront Ă rĂ©soudre efficacement diffĂ©rents problĂšmes dâoptimisation comme le placement des donnĂ©es ou le dimensionnement de tailles de tampons.
âą A partir dâun problĂšme dâoptimisation rĂ©solu par le coupleur
PaDaWan. Le stagiaire proposera une nouvelle rĂ©solution basĂ©e sur les mĂ©thodes dâapprentissage. Il devra notamment dĂ©cider des mesures Ă rĂ©aliser pour alimenter son modĂšle. Il mettra en Ćuvre lâalgorithme dâoptimisation basĂ© sur les donnĂ©es quâil a recueillies.
âą Les algorithmes pourront ensuite ĂȘtre intĂ©grĂ©s Ă lâoutil en production PaDaWAn.
Le stagiaire aura accĂšs aux calculateurs du centre de calcul TER@TEC pour rĂ©aliser ses expĂ©rimentations. [1] Myers, Kary et al. âPartitioning a Large Simulation as It Runsâ, arXiv preprint arXiv:1409.0909 (2014)
Domaines de spécialité requis Optimisation, apprentissage par ordinateur
Langages/logiciels Python, numpy, scikit- learn Mots clés Optimisation, machine-learning, extrapolation Formation recherchée BAC+4/5
Durée du stage 4 à 6 mois Stage pouvant se poursuivre en thÚse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 28
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre Algorithme de partitionnement de maillages sous contraintes mémoires
Référence SN-17-03
Contexte
Le CEA, acteur majeur en matiĂšre de recherche et dâinnovation, est reconnu comme un expert du domaine HPC grĂące Ă lâimpulsion du « Programme Simulation ». La simulation numĂ©rique consiste Ă reproduire par le calcul le fonctionnement dâun systĂšme, prĂ©alablement dĂ©crit par un ensemble de modĂšles. Le CEA/DAM Ă©tudie des schĂ©mas numĂ©riques dont les donnĂ©es sont portĂ©es par un maillage qui discrĂ©tise le domaine dâĂ©tude en Ă©lĂ©ments simples, les mailles. Pour une exĂ©cution sur un supercalculateur disposant de plusieurs unitĂ©s de calcul (UC), il est nĂ©cessaire de distribuer ce maillage et les donnĂ©es associĂ©es entre les diffĂ©rentes UC. Les outils classiques [1,2] partitionnent les donnĂ©es de la simulation entre UC, câest-Ă -dire attribuent chaque maille Ă exactement une et une seule UC, dans le but d'Ă©quilibrer les temps de calcul sur chaque UC. Or, l'espace mĂ©moire de chaque UC ayant tendance Ă diminuer sur les calculateurs modernes, il devient nĂ©cessaire de prendre en compte la consommation mĂ©moire de maniĂšre explicite lors du partitionnement. Dans ce but, des travaux rĂ©cents menĂ©s au CEA/DAM ont permis de valider des heuristiques de partitionnement sous contraintes mĂ©moire.
[1] C. Chevalier and F. Pellegrini, PT-SCOTCH: a tool for efficient parallel graph ordering. Parallel Computing, 34(6-8), pp 318-331, 2008. [2] E.G. Boman, U.V. Catalyurek, C. Chevalier, and K.D. Devine, The Zoltan and Isorropia Parallel Toolkits for Combinatorial Scientific Computing: Partitioning, Ordering, and Coloring, Scientific Programming vol. 20, no. 2, 2012,
Objectifs
Partant dâun algorithme existant de partitionnement, lâobjectif du stage est dâen fournir une implĂ©mentation C++ en sâappuyant sur le partitionneur Scotch [2] comme brique Ă©lĂ©mentaire. Plus prĂ©cisĂ©ment, lâalgorithme proposĂ© suit une structure multi-niveaux :
⹠Un graphe bi-parti G1 représentant le maillage initial est contracté en un graphe G2 de plus petite taille.
⹠Le problÚme de partitionnement es alors résolu pour G2 ⹠La solution obtenue pour G2 est raffinée en une solution pour G1.
Chacune des étapes fait intervenir des connaissances en théorie des graphes, optimisation et recherche locale.
Selon le dĂ©roulement du stage, lâimplĂ©mentation pourra ĂȘtre purement sĂ©quentiel, concurrente (plusieurs threads) ou hybride concurrente et distribuĂ©e (threads+MPI). Si ce stage requiert des compĂ©tences en algorithmique et en optimisation, il nĂ©cessite Ă©galement de bonnes connaissances en dĂ©veloppement de code C/C++.
Domaines de spécialité requis Informatique
Langages/logiciels C/C++, Python Mots clés Partitionnement, théorie des graphes, programmation paralléle Formation recherchée BAC+5 Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thÚse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 29
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre Algorithme Cubecover pour le maillage Référence SN-17-04
Contexte
Le CEA, acteur majeur en matiĂšre de recherche et dâinnovation, est reconnu comme un expert du domaine HPC grĂące Ă lâimpulsion du « Programme Simulation ». La simulation numĂ©rique consiste Ă reproduire par le calcul le fonctionnement dâun systĂšme, prĂ©alablement dĂ©crit par un ensemble de modĂšles. Le CEA/DAM sâintĂ©resse Ă des mĂ©thodes mathĂ©matiques qui sâappuient sur la discrĂ©tisation en hexaĂšdres du domaine dâĂ©tude. De tels maillages sont utilisĂ©s pour la rĂ©solution de problĂšmes physiques (interactions fluide-structures, aĂ©rodynamiqueâŠ). La gĂ©nĂ©ration automatique de maillages 3D purement hexaĂ©driques est un problĂšme difficile qui suscite de nombreuses recherches. Lâalgorithme Cubecover [1] permet de gĂ©nĂ©rer des maillages hexaĂ©driques de bonne qualitĂ©. Pour discrĂ©tiser un domaine gĂ©omĂ©trique D, cet algorithme requiert un « meta-mesh » de D, câest-Ă -dire une reprĂ©sentation par blocs de D. Cet algorithme nâest donc pas totalement automatisĂ© actuellement. En sâinspirant de travaux rĂ©cents sur lâutilisation de champs dâorientations pour la gĂ©nĂ©ration de maillages hexaĂ©driques [2] ou Ă dominantes hexaĂ©driques [3], il est toutefois concevable dâautomatiser la gĂ©nĂ©ration du « meta-mesh » nĂ©cessaire Ă lâalgorithme de Cube-cover.
[1] M. Nieser, U. Reitebuch, K. Polthier, CubeCover - Parameterization of 3D Volumes, Symposium of Geometry Processing, 2011. [2] N. Kowalski, F. Ledoux, and P. Frey. Smoothness driven frame field gen-eration for hexahedral meshing. Computer-Aided Design Volume 72, p. 65â77, March 2016. [3] N. Ray and D. Sokolov. On smooth frame field design, 2016. <hal-01245657>
Objectifs
Lâobjectif du stage proposĂ© est double :
âą Etudier et implĂ©menter lâalgorithme Cubecover au sein de la structure de donnĂ©es de type maillage GMDS (Generic Mesh Data Structure) du CEA/DAM.
âą Utiliser lâinformation contenue dans un champ dâorientations pour gĂ©nĂ©rer automatiquement un « meta-mesh ».
Les travaux réalisés seront évalués en considérant aussi bien des modÚles de CAO tels que des piÚces mécaniques et des modÚles surfaciques.
Domaines de spĂ©cialitĂ© requis Informatique â MathĂ©matiques appliquĂ©es
Langages/logiciels C/C++ Mots clés Maillage hexaédrique, géométrie algorithmique, algÚbre linéaire Formation recherchée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thÚse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 30
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre Polycubes pour la génération de maillages 3D Référence SN-17-05
Contexte
Le CEA, acteur majeur en matiĂšre de recherche et dâinnovation, est reconnu comme un expert du domaine HPC grĂące Ă lâimpulsion du « Programme Simulation ». La simulation numĂ©rique consiste Ă reproduire par le calcul le fonctionnement dâun systĂšme, prĂ©alablement dĂ©crit par un ensemble de modĂšles. Le CEA/DAM Ă©tudie des schĂ©mas numĂ©riques reposant sur la discrĂ©tisation du domaine d'Ă©tude en un ensemble d'Ă©lĂ©ments simples (triangles, quadrangles en 2D ; tĂ©traĂšdres, hexaĂšdres en 3D). Certaines simulations rĂ©alisĂ©es au CEA/DAM nĂ©cessitent des maillages 3D structurĂ©s composĂ©s uniquement dâhexaĂšdres. Dans ce contexte, le CEA/DAM souhaite Ă©valuer les algorithmes gĂ©nĂ©rant des polycubes [1,2,3]. Ces algorithmes issus de la communautĂ© infographique gĂ©nĂšrent un maillage hexaĂ©drique du domaine dâĂ©tude en le dĂ©formant pour obtenir un polycube, c'est-Ă -dire un polyĂšdre dont toutes les facettes sont alignĂ©es avec les axes X, Y, Z du repĂšre dâorigine. Une fois ce polycube gĂ©nĂ©rĂ©, il est "aisĂ©" de le discrĂ©tiser Ă l'aide d'une grille, puis de projeter cette grille sur le domaine dâĂ©tude pour obtenir un maillage purement hexaĂ©drique de ce dernier.
[1] J. Gregson, A. Sheffer, and E. Zhang. All-hex mesh generation via volumetric polycube deformation. Comput. Graph. Forum, 30(5) :1407â1416, 2011. [2] J. Huang, T. Jiang, Z. Shi, Y. Tong, H. Bao, and M. Desbrun. L1-based con-struction of polycube maps from complex shapes. ACM Trans. Graph., 33(3) :25 :1â25 :11, June 2014. [3] W. Yu, K. Zhang, S. Wan, and X. Li. Optimizing polycube domain construction for hexahedral remeshing. Computer Aided Design, 46 :58â68, 2014.
Objectifs
Lâobjectif du stage proposĂ© est âą dâimplĂ©menter et comparer les algorithmes proposĂ©s dans [1] et
[3] afin dâĂ©valuer les points forts et points faibles de chacun dâentre eux.
LâimplĂ©mentation sera effectuĂ©e en C++ en utilisant la structure de donnĂ©es de type maillage GMDS (Generic Mesh Data Structure) du CEA/DAM.
⹠Dans un premier temps, les algorithmes seront comparés en termes de qualité des maillages générés. Les modÚles géométriques étudiés seront des piÚces mécaniques plus ou moins complexes.
âą Puis, suivant lâavancĂ©e des travaux, un algorithme sera privilĂ©giĂ© et des amĂ©liorations seront apportĂ©es.
Domaines de spĂ©cialitĂ© requis Informatique â MathĂ©matiques appliquĂ©es
Langages/logiciels C/C++ Mots clés Maillage hexaédrique, géométrie algorithmique, algÚbre linéaire Formation recherchée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thÚse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 31
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre Algorithme de submapping pour la génération de maillages 2D Référence SN-17-06
Contexte
Le CEA, acteur majeur en matiĂšre de recherche et dâinnovation, est reconnu comme un expert du domaine HPC grĂące Ă lâimpulsion du « Programme Simulation ». La simulation numĂ©rique consiste Ă reproduire par le calcul le fonctionnement dâun systĂšme, prĂ©alablement dĂ©crit par un ensemble de modĂšles. Le CEA/DAM Ă©tudie des schĂ©mas numĂ©riques reposant sur la discrĂ©tisation du domaine d'Ă©tude en un ensemble d'Ă©lĂ©ments simples (triangles, quadrangles en 2D ; tĂ©traĂšdres, hexaĂšdres en 3D). Pour minimiser le temps de prĂ© traitement, le CEA/DAM sâintĂ©resse Ă la gĂ©nĂ©ration automatique de maillages quadrangulaires. Les mĂ©thodes de submapping sâappuient sur la rĂ©solution de problĂšmes dâoptimisation Ă lâaide de la programmation linĂ©aire en nombres entiers [1,2]. Le plus souvent basĂ© sur des solveurs open-source tels que GLPK [3], les problĂšmes dâoptimisation abordĂ©s sont rĂ©solus de maniĂšre exacte (recherche dâune meilleure solution). Pour un nombre important de variables et de contraintes, lâutilisation dâun algorithme exact peut ĂȘtre trop coĂ»teuse en temps de calcul. Câest pourquoi de telles mĂ©thodes ne sont pas appliquĂ©es actuellement en 3D alors que les rĂ©sultats obtenus sont plus que prometteurs. [1] E. Ruiz-GironĂ©s and J. Sarrate. Generation of structured hexahedral meshes in volumes with holes. Finite Elements in Analysis and Design, 46(4) :391â406, 2010. [2] S. Cai and T. Tautges. Optimizing corner assignment of submap surfaces. In proceedings of the 24th International Meshing Roundtable, pages 83â95. Proce-dia Engineering, 2015. [3] GNU Linear Programming Kit, https://www.gnu.org/software/glpk/.
Objectifs
Lâobjectif du stage est de : âą Ă©tudier un algorithme de submapping 2D basĂ© sur une rĂ©solution
exacte, ⹠proposer une version approchée avec garantie de performances.
Les travaux rĂ©alisĂ©s seront Ă©valuĂ©s :ThĂ©oriquement par le calcul de facteurs dâapproximations et de complexitĂ©s obtenus pour les diffĂ©rentes versions dâalgorithmes proposĂ©s.
âą expĂ©rimentalement par lâimplĂ©mentation des algorithmes en C/C++ sur la structure de donnĂ©es open-source GMDS dĂ©veloppĂ©e et maintenue au CEA/DAM.
Au niveau expĂ©rimental, le stage dĂ©butera sur une implĂ©mentation existante de lâalgorithme proposĂ© dans [1] et utilisant GLPK et la structure de donnĂ©es de type maillage GMDS (Generic Mesh Data Structure) du CEA/DAM.
Domaines de spécialité requis Informatique
Langages/logiciels C/C++ Mots clĂ©s Maillage, problĂšme dâoptimisations, algorithmes exacts et approchĂ©s Formation recherchĂ©e BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thÚse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 32
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Analyse des performances de régions parallÚles OpenMP
Référence SN-17-07
Contexte
OpenMP est un modĂšle de programmation parallĂšle reposant sur le paradigme Ă mĂ©moire partagĂ©e. Il est de plus en plus utilisĂ© dans les applications Ă haute performance pour exploiter les capacitĂ©s des nĆuds de calculs des supercalculateurs. Il propose, entre autres, de partager du travail et des donnĂ©es entre les threads, permettant ainsi une rĂ©duction de la consommation mĂ©moire et un meilleur Ă©quilibrage de charge. Mais lâapproche incrĂ©mentale consistant Ă ajouter des directives OpenMP dans un code parallĂšle existant peut ĂȘtre complexe et il est difficile de comprendre les performances dâun tel code en pleine Ă©volution. Il devient alors nĂ©cessaire dâĂ©tudier les performances des âârĂ©gions parallĂšlesââ OpenMP.
Objectifs
Lâobjectif de ce stage est de : âą dĂ©velopper un environnement de profilage dâapplications avec une
analyse associĂ©e permettant de capturer le comportement dâun code OpenMP haute performance,
⹠extraire un bilan sur le degré de parallélisation des différentes parties du code.
Pour ce faire, ce stage pourra sâappuyer sur la plateforme MALP (Multi-Application on-Line Profiling est un outil de profilage dont le but est la qualification des applications massivement parallĂšles) et sur lâinterface outil OMPT pour OpenMP. Lâanalyse se focalisera, dans un premier temps, sur les performances des rĂ©gions parallĂšles, fournissant ainsi Ă lâutilisateur une indication sur lâaccĂ©lĂ©ration de ces diffĂ©rentes rĂ©gions en fonction du nombre de threads utilisĂ©s. GrĂące Ă cette information, il sera alors possible de diriger les optimisations vers une partie spĂ©cifique du code source. Les applications cibles seront extraites des benchmarks CORAL.
Domaines de spécialité requis Informatique
Langages/logiciels C, OpenMP, MPC
Mots clés Calcul hautes performances, OpenMP, OMPT, MPC, MALP
Formation recherchée BAC+5
Durée du stage 6 mois
Stage pouvant se poursuivre en thĂšse
Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 33
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre Analyse du placement des données en mémoire en relation avec un ordonnanceur de threads
Référence SN-17-08
Contexte
Avec lâarrivĂ©e des architectures many/multi-cĆurs, lâutilisation du multithreading devient incontournable sur les architectures modernes qui vont du tĂ©lĂ©phone portable au supercalcuteur. Le bon fonctionnement dâune application multithread repose donc sur un composant essentiel : lâordonnanceur de threads. Ce dernier est en charge de choisir les threads en cours dâexĂ©cution sur chacun des cĆurs des processeurs. Il est donc important, pour obtenir de bonnes performances, de bien comprendre le fonctionnement de cet ordonnanceur. Sur supercalculateur, un autre paramĂštre entre en compte dans les performances dâune application : le placement de donnĂ©es en mĂ©moire. Ce placement doit ĂȘtre gĂ©rĂ© en concordance avec lâordonnanceur des threads.
Objectifs
Lâobjectif de ce stage est alors de :
âą DĂ©velopper un environnement de profilage dâapplications avec une
analyse associĂ©e permettant de capturer le comportement dâun ordonnanceur de thread et dâun allocateur mĂ©moire associĂ©.
Pour ce faire, ce stage sâappuiera sur la plateforme MALP (http://malp.hpcframework.com) qui est un outil de profilage dont le but est la qualification des applications massivement parallĂšles. Ce stage sâappuiera aussi sur lâordonnanceur de thread utilisateur et lâallocateur mĂ©moire intĂ©grĂ© au support exĂ©cutif MPC (http://mpc.hpcframework.com). GrĂące Ă cette information, il sera alors possible de diriger les optimisations relatives au placement des donnĂ©es et/ou des threads vers une partie spĂ©cifique du code source. Les applications cibles seront extraites des benchmarks CORAL.
Domaines de spécialité requis Informatique
Langages/logiciels C, OpenMP, MPI, MPC
Mots clés Calcul hautes performances, OpenMP, MPI, MPC, MALP
Formation recherchée BAC+5
Durée du stage 6 mois
Stage pouvant se poursuivre en thĂšse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 34
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre SchĂ©mas implicites dâordre trĂšs Ă©levĂ© pour la dynamique des gaz RĂ©fĂ©rence SN-17-09
Contexte
Des travaux menĂ©s rĂ©cemment dans notre Laboratoire ont permis dâisoler une famille de schĂ©mas pour la rĂ©solution des Ă©quations dâEuler qui prĂ©sente de nombreux avantages (splittings directionnels dâordres trĂšs Ă©levĂ©s, Ă©quations dâĂ©tat arbitraires, formulĂ©s en Ă©nergie interne mais conservatifs en Ă©nergie totale, utilisables sans correction en rĂ©gimes chocs forts et/ou bas-Mach).
LâĂ©valuation a Ă©tĂ© faite dans le cadre dâintĂ©grations explicites en temps.
Au cours de ce stage, il sâagira dâĂ©valuer des versions implicites de la phase de balayage 1D permettant de conserver les mĂȘmes propriĂ©tĂ©s.
Gautier Dakin, Hervé Jourdren, « High-order accurate Lagrange-remap hydrodynamic schemes on staggered Cartesian grids », C. R. Acad. Sci. Paris, Ser. I 354 (2016) 211-217.
Objectifs
Le stage a pour objectifs dâĂ©tudier : âą Extension Navier-Stokes + gravitĂ© des schĂ©mas semi-discrets,
⹠Sélection de séquences Runge-Kutta implicites en temps,
⹠Méthode itérative point fixe,
⹠Méthode itérative Jacobian-Free Newton-Krylov,
⹠Cas-tests de la littérature,
⹠Cas-test spécifique dans 3 régimes successifs distincts : 1)
atmosphĂšre aux temps longs avec retour vers lâĂ©quilibre hydrostatique, 2) atmosphĂšre Ă lâĂ©quilibre avec source acoustique ou 3) choc fort,
⹠Un code 1D spécifique C/C++ sera développé, avec scripts de
vérification et de non-régression en langage Python,
âą Un code 2D cartĂ©sien pourra alors ĂȘtre prototypĂ© par appel des routines 1D (mĂ©thode des directions alternĂ©es).
Domaines de spécialité requis Analyse Numérique, Mathématiques Appliquées
Langages/logiciels C/C++, Python
Mots-clĂ©s Equations dâEuler, Navier-Stokes, schĂ©mas volumes finis, intĂ©grations Runge-Kutta DIRK, Rosenbrock, Jacobian-free Newton-Krylov.
Formation recherchée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thÚse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 35
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre OpĂ©rateur de diffusion vectoriel pour lâhydrodynamique
lagrangienne turbulente sur maillage déformé
Référence SN-17-10
Contexte
La description lagrangienne consiste Ă suivre dans le temps les particules fluides le long de leurs trajectoires. Elle est souvent utilisĂ©e pour rĂ©soudre les Ă©quations d'Euler en dynamique multi-matĂ©riaux, car elle permet de prĂ©server exactement les interfaces des matĂ©riaux au niveau discret. Cependant, elle n'est pas toujours suffisante pour dĂ©crire la dynamique des gaz compressibles. C'est le cas si le rapport entre les forces d'inertie et visqueuse est localement faible (nombre de Reynolds petit). Le terme de diffusion molĂ©culaire des Ă©quations de Navier-Stokes n'est alors plus nĂ©gligeable et doit ĂȘtre pris en compte. Si le nombre de Reynolds est grand, les modĂ©lisations de la turbulence (Reynolds Averaged Navier-Stokes-RANS ou Large-Eddy-Simulation-LES) sont gĂ©nĂ©ralement basĂ©es sur l'approximation de Boussinesq. Celle-ci consiste Ă approcher l'effet de la turbulence non rĂ©solue sur l'Ă©coulement moyen par un opĂ©rateur de diffusion, proportionnel au tenseur des contraintes.
Objectifs
Le stage a pour objectifs de :
⹠proposer, d'analyser numériquement et de tester différentes
stratégies de discrétisation de l'opérateur de diffusion, et son couplage au solveur de Godunov acoustique pour les équations d'Euler [1,2].
Les stratégies retenues seront testées en 1D et 2D sur maillages non réguliers dans un code écrit en C++. Une bonne connaissance du langage est souhaitée.
[1] B. Després et C. Mazeran, Arch. Rat. Mech. Anal., 2005, 178, pages 327-372. [2] P.-H. Maire, R. Abgrall, J. Breil et J. Ovadia, Siam J. Sci. Comp., 2007, 29.
Domaines de spécialité requis Analyse numérique
Langages/logiciels C++
Mots clés simulation numérique, systÚme hyperbolique, lois de conservation
Formation recherchée BAC+5
Durée du stage 5 à 6 mois
Stage pouvant se poursuivre en thĂšse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 36
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Maximisation du potentiel dâasynchronisme dans un code MPI
Référence SN-17-11
Contexte
Dans le domaine du calcul haute performance, les applications utilisent principalement le modĂšle de programmation parallĂšle MPI (Message Passing Interface) pour exploiter les ressources dâun supercalculateur. Ce modĂšle se base sur le paradigme Ă mĂ©moire distribuĂ©e, impliquant des Ă©changes de donnĂ©es par envoi/rĂ©ception de messages entre les diffĂ©rentes tĂąches parallĂšles. Le modĂšle de programmation MPI offre la possibilitĂ© de rĂ©aliser ces Ă©changes de messages en mode « non bloquants », c'est-Ă -dire de pouvoir recouvrir les Ă©changes du message par de l'exĂ©cution de programme utilisateur jusqu'Ă un point de synchronisation placĂ© par l'utilisateur. Cette pĂ©riode reprĂ©sente le temps dâasynchronisme de lâapplication.
Objectifs
Lâobjectif du stage est de : âą DĂ©velopper un outil analysant le potentiel dâasynchronisme dans un
code MPI. Lâoutil combinera des informations relevĂ©es par le compilateur et par le support exĂ©cutif MPI pour produire cette analyse, (Lâoutil devra reconnaĂźtre dans un code MPI une liste prĂ©dĂ©terminĂ©e de communications bloquantes et non-bloquantes.)
âą Une analyse de dĂ©pendances de donnĂ©es devra ĂȘtre rĂ©alisĂ©e sur les Ă©lĂ©ments en entrĂ©e et en sortie de chaque communication bloquante. Le but est de remplacer lâappel bloquant par les appels de lancement et de complĂ©tion dâune communication non-bloquante,
âą Le mĂȘme type dâanalyse devra ĂȘtre rĂ©alisĂ© sur les donnĂ©es en entrĂ©e des fonctions de lancement de communications non-bloquantes, et sur les donnĂ©es en sorties des fonctions de complĂ©tions de communications non-bloquantes.
A partir de son analyse de donnĂ©es, lâoutil devra fournir des informations sur la localisation du code oĂč insĂ©rer ces appels de lancement et de complĂ©tion de communications non-bloquantes pour maximiser le potentiel dâasynchronisme.
Domaines de spécialité requis Informatique
Langages/logiciels C, MPI, MPC
Mots clés Calcul hautes performances, MPI, Asynchronisme, Communications non-bloquantes
Formation recherchée BAC+5
Durée du stage 5 à 6 mois
Stage pouvant se poursuivre en thĂšse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 37
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
13 LES STAGES EN SECURITE INFORMATIQUE
Titre
R&D autour de la cartographie réseau
Référence SI-17-01
Contexte
La cartographie active de réseau consiste à interroger des machines et des services et à en tirer des informations quant aux systÚmes et logiciels utilisés. Certaines fonctionnalités font défaut aux principaux outils de cartographie réseau existants (par ex : Nmap, Zmap).
Objectifs
Il sâagira dâajouter de nouvelles fonctionnalitĂ©s et de les tester largement sur des rĂ©seaux locaux et sur Internet. Le stage consistera Ă dĂ©velopper et implĂ©menter les fonctionnalitĂ©s suivantes :
âą index des fichiers partagĂ©s, âą large distribution des analyses (scans), âą capture dâĂ©cran de diffĂ©rents services, âą Indexation efficace des rĂ©sultats.
Domaines de spĂ©cialitĂ© requis SĂ©curitĂ© des systĂšmes dâinformation, RĂ©seaux
Langages/logiciels Python, Nmap + NSE (LUA), ElasticSearch, MongoDB
Mots clés Scan réseau, découverte réseau Formation recherchée BAC+5
Durée du stage 3 à 6 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 38
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
DĂ©-obscurcissement de JavaScript
Référence SI-17-02
Contexte
Les « Exploit Kits » sont des kits clĂ©-en-main dâexploitation de vulnĂ©rabilitĂ©s, visant principalement les navigateurs et les diffĂ©rents plug-ins associĂ©s. Afin dâĂ©viter les dĂ©tections automatiques, ils embarquent des moteurs dâobscurcissement de leurs diffĂ©rents composants. Une partie consĂ©quente de ces composants (notamment la dĂ©tection de version, dâantivirus, la crĂ©ation de la charge finale, etc.) est dĂ©veloppĂ©e en JavaScript. Plus lâobscurcissement est important et efficace, plus les ressources (temps, compĂ©tences) des analystes vont ĂȘtre consommĂ©es, et donc plus la « durĂ©e de vie » de la plateforme dâattaque sera long.
Objectifs
Le stage consistera Ă :
âą faire un Ă©tat des lieux des mĂ©thodes dâobscurcissements utilisĂ©es (sources publiques et interne au service),
âą faire un inventaire des outils existants et de leurs limitations (par ex : Google V8, SpiderMonkey, Thug),
âą proposer des mĂ©thodes et des outils permettant dâanalyser ce genre de code, câest-Ă -dire permettant dâamĂ©liorer la lisibilitĂ©, de dĂ©couvrir interactivement les possibilitĂ©s dâattaques embarquĂ©es, dâannoncer une cible virtuelle et dâobserver le comportement du code, âŠ
Ces livrables devront pouvoir ĂȘtre facilement adaptables aux nouvelles mĂ©thodes et implĂ©mentations ajoutĂ©es dans les Exploit Kits (potentiellement plusieurs fois par semaine). Les outils seront testĂ©s sur des cas rĂ©els, Ă lâĂ©tat de lâart et rencontrĂ©s tous les jours sur des rĂ©seaux connectĂ©s Ă Internet.
Domaines de spĂ©cialitĂ© requis Analyse de code, mĂ©thode dâobscurcissement
Langages/logiciels JavaScript, Python
Mots clés ExploitKits, JavaScript, Obscurcissement, Analyse et extraction de malwares
Formation recherchée BAC+5
Durée du stage 6 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 39
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Reconnaissance automatique de fonctions par effets de
bord
Référence SI-17-03
Contexte
Sibyl est un outil, open-source, dĂ©veloppĂ© au CEA/DAM. Il a pour but de reconnaĂźtre des fonctions connues dans un binaire en « brute-forçant » leurs APIs et en comparant leurs effets de bord avec un ensemble de signatures. MĂȘme si lâoutil est encore rĂ©cent, il est dĂ©jĂ utilisĂ© notamment dans lâanalyse de codes malveillants (malwares) et pour lâaudit de logiciels type firmware, apportant un gain de temps important.
Objectifs
Les objectifs du stage sont dâĂ©tendre les capacitĂ©s de lâoutil, au travers le dĂ©veloppement de fonctionnalitĂ©s, notamment en : âą agrandissant le pool de signatures (par exemple : ajout de la librairie
OpenSSL) ; ⹠améliorant le parallélisme (par exemple : port OpenMPI, réduction de
lâempreinte) ; âą proposant de nouvelles applications (par exemple : lâoutil pourrait
permettre de rechercher automatiquement lâABI des fonctions, de faire du diffĂ©rentiel de fonctions en comparant leurs effets de bord) ;
âą exprimant de maniĂšre indĂ©pendante de lâABI et de lâarchitecture de nouveaux Ă©lĂ©ments (par exemple : reprĂ©sentation des structures en tenant compte des techniques de packing des compilateurs).
Domaines de spécialité requis Reverse Engineering
Langages/logiciels Python, Miasm (facultatif)
Mots clés Miasm, Signature de fonctions, Firmware, Malware, Reverse-Engineering Formation recherchée BAC+4
Durée du stage 3 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 40
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre
Techniques de fuzzing et d'audit de code appliquĂ©es Ă
l'évaluation de la sécurité de systÚmes de fichiers réseau
Référence SI-17-04
Contexte
Les serveurs de fichiers sont un point névralgique de toute infrastructure informatique d'entreprise. D'un point de vue sécurité, il est essentiel qu'ils puissent garantir un contrÎle des accÚs correct et précis. Ceci implique à la fois une bonne robustesse du code et des fonctionnalités de sécurité correctement pensées et implémentées. En particulier, pour ses clusters de calcul scientifique (HPC), le CEA/DAM construit des systÚmes de fichiers réseau à grande échelle, avec des capacités de stockage de plusieurs dizaines de Po et des bandes passantes de plusieurs centaines de Go/s. Ainsi, les choix d'implémentation sont guidés autant par les performances que par la sécurité. Au sein de ces architectures, un logiciel est utilisé en particulier, le serveur Ganesha en environnement Linux. Il s'agit d'une implémentation en espace utilisateur d'un serveur de différents protocoles dont NFS et v9fs (aussi appelé 9P). Il est principalement développé au CEA/DAM.
Objectifs
L'objectif du stage est :
⹠d'effectuer une évaluation de la sécurité de Ganesha, afin de mettre en évidence d'éventuelles vulnérabilités résiduelles.
Afin de mener cette Ă©valuation, les techniques envisagĂ©es sont de deux types. D'une part, les techniques de fuzzing peuvent ĂȘtre appliquĂ©es du point de vue des appels systĂšme liĂ©s au VFS de Linux, ou du point de vue du rĂ©seau. D'autre part, les techniques d'analyse de code source ont pour but de dĂ©tecter des erreurs d'implĂ©mentation menant Ă des vulnĂ©rabilitĂ©s ou Ă des dĂ©fauts dans les fonctions de sĂ©curitĂ©. Le travail du stagiaire sera a priori dĂ©coupĂ© en deux phases appliquĂ©es aux deux types de techniques :
⹠une phase de recensement des outils et techniques adaptées, ⹠une phase de test sur le logiciel Ganesha.
Domaines de spécialité requis Sécurité systÚme, systÚmes de fichiers réseau
Langages/logiciels Ganesha : https://github.com/nfs-ganesha/nfs-ganesha v9fs : https://www.kernel.org/doc/Documentation/filesystems/9p.txt
Mots clés Network file system, fuzzing, analyse du code source Formation recherchée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 41
Propositions de stages informatiques 2017 au CEA/DAM Ile de France
Titre Techniques de reverse engineering de protocoles réseaux propriétaires par émulation de binaires et data slicing
Référence SI-17-05
Contexte
Il n'est pas rare de voir dĂ©ployĂ©es des solutions propriĂ©taires dans les grandes entreprises, Ă la fois logicielles ou matĂ©rielles. Dans les deux cas, les produits concernĂ©s sont susceptibles d'ĂȘtre raccordĂ©s au systĂšme d'information, et ainsi d'offrir Ă un attaquant potentiel un angle d'attaque difficile Ă investiguer. Les techniques usuelles de reverse engineering peuvent ĂȘtre laborieuses quand il s'agit de comprendre et reverser un protocole rĂ©seau propriĂ©taire. GrĂące aux techniques de data tainting et de data slicing, il est possible de formaliser (ou au moins tracer) les fonctions de transfert des donnĂ©es envoyĂ©es sur le rĂ©seau : les opĂ©rations qui sont effectuĂ©es Ă partir des donnĂ©es reçues sur les interfaces rĂ©seau, ou la maniĂšre dont sont construites les donnĂ©es qui sont envoyĂ©es sur celui-ci. A travers une sĂ©rie de scĂ©narii d'exĂ©cutions possibles, les techniques usuelles d'Ă©mulation de binaires permettent de gĂ©nĂ©rer des traces analysables Ă partir desquelles il est envisageable de reconstruire des protocoles Ă l'envers, et d'en retrouver une partie des spĂ©cifications. Ă partir de lĂ , des angles d'attaque Ă distance peuvent ĂȘtre Ă©laborĂ©s, et des vulnĂ©rabilitĂ©s d'implĂ©mentation exploitĂ©es. Il serait aussi intĂ©ressant de pouvoir visualiser les rĂ©sultats de ce type d'analyses graphiquement (sous forme de graphes d'appels avec les valeurs des arguments passĂ©s aux fonctions par exemple), et cela malgrĂ© la grande quantitĂ© de donnĂ©es potentiellement gĂ©nĂ©rĂ©e.
Objectifs
Les objectifs chronologiques sont : ⹠réalisation d'un état de l'art des publications et outils déjà existants dans
ce domaine ; ⹠compréhension et maßtrise de Miasm2, une plateforme Python complÚte
de reverse engineering ; ⹠création de scenarii simples de tests unitaires pour valider le
fonctionnement de l'outil ; ⹠développement d'un outil qui exécute un binaire et aide à la
reconstruction de son protocole ; ⹠mise en place d'une solution ergonomique de visualisation des résultats
sous forme graphique. Il sera également possible d'atteindre les objectifs supplémentaires suivants : ⹠valider le fonctionnement sur des binaires réels, compilés pour des
architectures différentes ; ⹠développer un module capable de détecter les erreurs d'implémentation
dans les binaires analysés, et de construire un payload qui permettra l'exploitation directe ou au moins un fuzzer.
Domaines de spécialité requis Reverse engineering
Langages/logiciels Python, Miasm Mots clés Reverse Engineering, Protocoles, Développement Formation recherchée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thÚse non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail Ă lâadresse suivante : [email protected] Pour tout renseignement complĂ©mentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 42