Étienne MAUFFRET

Doctorant, Polytech’Annecy-Chambery.

Contact

Courriel :  Etienne.Mauffret– @ –univ-smb.fr

Téléphone : +33(0) 4 50 09 42 09

Télécopie : +33(0) 4 50 09 65 59

Bureau : Axxx

Adresse : LISTIC – Polytech Annecy-Chambery, BP 80439, 74944 Annecy le Vieux Cedex, France

Etienne Mauffret est doctorant à l’université Savoie Mont Blanc depuis octobre 2017. Il effectue des vacations d’enseignement à Polytech’ Annecy-Chambéry et effectue sa recherche au LISTIC (dont il est membre du conseil du laboratoire).

Groupe:  Réseaux et Systèmes Logiciels Répartis

Publications :  référencées sur HAL

Thèse

Sujet : Gestion de données distribuées à grande échelle — placement, indexation, cohérence modulaire et tolérance aux fautes

Résumé : Cette thèse s’inscrit dans le cadre du projet ANR RainbowFS dont le consortium est composé de : (i) Université Pierre et Marie Curie (Paris VI), (ii) Université Savoie Mont Blanc, (iii) Laboratoire d’informatique de Grenoble (LIG), (iv) Télécom SudParis (TSP), et (v) l’industriel Scality. Cette thèse se fera au sein du laboratoire LISTIC,  de l’université Savoie Mont Blanc. Elle sera dirigée par Sébastien  Monnet (LISTIC/USMB).

Le but du projet RainbowFS est de concevoir et d’implémenter une approche pour la gestion des données permettant d’offrir le bon niveau de cohérence, à l’échelle d’un cloud. Les systèmes existant obligent les applications à utiliser des modèles de cohérence prédéfinis. Le projet RainbowFS propose des outils pour co-concevoir les applications et leurs protocoles de cohérence. Le but est de permettre d’offrir la disponibilité des données tout en préservant les garanties de cohérence (le respect d’invariants). Une grande partie des opérations peuvent être conçues de manière à pouvoir être réalisées de manière asynchrone, des synchronisations ont lieu lorsque cela est strictement nécessaire.

Cette thèse se focalisera principalement sur le placement des données, leur localisation/indexation, mais également sur leur cohérence et la tolérance aux fautes. En effet, toutes ces problématiques sont fortement liées. Les données sont géo-distribuées et répliquées. Les différentes copies d’une donnée doivent être placées (et déplacées)  de manière judicieuse, en prenant en compte les accès (fréquence et type)  mais également des critères de tolérance aux fautes (afin de faire face à des fautes corrélées par exemple), de confidentialité, etc. Lorsque les copies sont placées en fonction de critères précis, il n’est pas possible d’utiliser un mécanisme de localisation implicite à l’image de ce qui peut exister dans les tables de hachage distribuées (DHT), il devient donc nécessaire de concevoir des mécanismes d’indexation/localisation permettant des accès efficaces aux données. De plus, dans des systèmes à grande échelle, les arrivées et départs de nœuds sont fréquents. Les travaux menés dans cette thèse prendront en compte cette volatilité.
Mots-clefs: Systèmes Distribués large échelle, Tolérance aux fautes, Placement des données

Encadrant : Sebastien Monnet

Co-encadrant : Flavien Vernier

Début de la thèse : Octobre 2017

Ecole doctorale : SISEO « Sciences et Ingénierie des Systèmes, de l’Environnement et des Organisations »

Enseignements

  • Algorithmique et Programmation (PEIP, première année )
  • Graphes et Langages (IDU, première année)
  • Projet Algorithmique (IDU,première année)
  • Conception et Programmation Orientées Objet (IAI, première année )