Lynda FERRAGUIG

Stéphane PerrinDoctorante, Polytech Annecy-Chambéry.

Doctorante en informatique

 

 

  • Contact

Email/ Courriel : lynda.ferraguig@univ-smb.fr / gl_ferraguig@esi.dz

Phone number/ Téléphone : +33 (0)780863227

Télécopie : +33 (0)4 50 09 65 59

Office/ Bureau : A221

Adress/ Adresse : LISTIC – Polytech Annecy-Chambéry, BP 80439 – Annecy le Vieux, 74944 ANNECY Cedex, France

  •  Thesis Title/ titre Thèse

Bias mitigation for collaborative and ethical learning on dynamic data

Réduction des biais pour un apprentissage collaboratif et éthique sur des données dynamiques

  • Reaserch team/ Groupe

AFuté/ Regard

  • Abstract/ Résumé :

Machine learning is increasingly used in decision making processes and allows us to solve increasingly complex problems. However, this approach increases the risk of discriminating against certain populations of data, whether they are related to physical systems or to people. This risk is notably linked to the biases introduced in the learning process. Federated learning, a new machine learning paradigm that is gaining ground in response to the issues of data confidentiality and decentralization of calculations, is also concerned. This collaborative approach keeps the data close to its source and makes the management of bias more complex. Indeed, the confidentiality constraints and, depending on the case, the privacy protection imposed in this approach do not allow the use of classical bias mitigation techniques. Moreover, one of the purposes of federated learning is to build models adapted to hierarchically organized populations in order to generate intermediate models adapted to groups of different populations. Fundamental questions then arise on how to create and control the temporal evolution of this hierarchy while preserving data confidentiality and reducing bias. The state of the art does not currently report any work on this general framework or is limited to a global non-hierarchical approach. The objective of the thesis is then to propose methods for detecting and eliminating both global and sub-population biases by taking into account the dynamic aspect of the data and the privacy constraints by relying on realistic case studies from the state of the art and from projects within the LISTIC.

 

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

L’apprentissage automatique est utilisé de façon croissante dans les processus de prise de décision et nous permet de résoudre des problèmes de plus en plus complexes. Cette approche augmente néanmoins le risque de discriminations envers certaines populations de données, qu’elles soient liées à des systèmes physiques ou à des personnes. Ce risque est notamment lié aux biais introduits dans le processus d’apprentissage. L’apprentissage fédéré, un nouveau paradigme de l’apprentissage automatique qui tend à s’imposer pour répondre aux problématiques de confidentialité des données et de décentralisation des calculs est également concerné. Cette approche collaborative maintient les données proches de leur source et rend alors plus complexe la gestion des biais. En effet, les contraintes de confidentialité et, selon les cas, de protection de vie privée imposées dans cette approche ne permettent pas d’utiliser les techniques classiques d’atténuation des biais. Par ailleurs, l’une des finalités de l’apprentissage fédéré est de construire des modèles adaptés à des populations organisées de façon hiérarchique dans le but de générer des modèles intermédiaires adaptés à des groupes de populations différentes. Des questions fondamentales se posent alors sur la création et la maîtrise de l’évolution temporelle de cette hiérarchie tout en préservant la confidentialité des données et en réduisant les biais. L’état de l’art ne rapporte actuellement pas de travaux sur ce cadre général ou se limite à une approche globale non hiérarchique. L’objectif de la thèse est alors de proposer des méthodes de détection et d’élimination des biais à la fois globaux et liés à des sous-populations en prenant en compte l’aspect dynamique des données et les contraintes de protection de vie privée en s’appuyant sur des cas d’étude réalistes de l’état de l’art et issus de projets au sein du LISTIC.

  • Key-words/ Mots-clefs :

  1. Bias
  2. Collaborative learning
  3. Ethical learning
  4. Dynamic data

 

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

  1. Biais
  2. Apprentissage collaboratif
  3. Apprentissage éthique
  4. Données dynamiques
  • Publications

https://hal.science/hal-03343288/document

  • Phd supervisor/ Encadrant 

Pr Benoit Alexandre

  • Phd co-supervisor/ Co-encadrant

Dr Loukil Faiza

Start of the thesis/Début de la thèse

15/11/22

  • Doctoral school/ Ecole doctorale

SIE