Stage M2 Informatique
Titre du stage : Approches prédictives pour l’étude de comportements
LIPN – Université Sorbonne Paris Nord
Informations générales
– Encadrants : Nathalie Pernelle, Céline Rouveirol (LIPN, Université Sorbonne Paris Nord), Noémi Berlin, Magali Dumontet (EconomiX, Université Paris-Nanterre) – Contacts : pernelle@lipn.univ-paris13.fr , rouveirol@lipn.univ-paris13.fr
– Localisation : LIPN
– Durée : 6 mois – stage rémunéré
– Mots-clés : Apprentissage symbolique, Approches statistiques, Découverte de règles, Prédiction, Etude de comportement, Explications, Causalité
– Possibilité de poursuite en thèse financée à l’issue du stage, financement de thèse dans le cadre du projet ANR ERMES (Impact des messages et des pairs sur le changement de comportement alimentaire).
Contexte du stage
Depuis plusieurs années, les pouvoirs publics s’inquiètent de l’insuffisance de l’offre de médecins et de leur mauvaise répartition entre les spécialités médicales et sur le territoire. Dans l’ensemble des pays de l’OCDE, les décideurs publics sont confrontés à deux problèmes récurrents : certaines spécialités sont peu attractives pour les étudiants en médecine et la répartition géographique des médecins est très inégale sur le territoire. L’inégale répartition des médecins sur le territoire est un enjeu majeur pour la régulation de l’offre de soins.
En France, deux instruments de régulation ont été utilisés pour réguler le nombre de médecins exerçant par spécialité. (i) Le numerus clausus (jusqu’en 2020) définissant le nombre d’étudiants en médecine autorisés à poursuivre en 2ème année de médecine, (ii) en 6ème année de médecine, le nombre de postes d’internes ouverts par spécialité et lieu géographique (28 subdivisions géographiques).
Dans le cadre de ce projet de recherche, nous nous intéresserons plus particulièrement à ce deuxième instrument de régulation.
Le laboratoire de recherche en Sciences Economiques de l’Université Paris Nanterre (EconomiX) a participé à la réalisation d’une enquête en ligne par questionnaire en mars 2023 sur les étudiants en médecine qui étaient dans leur 6ème année de médecine. Dans cette enquête quatre blocs de variables ont été récoltés : (1) les préférences des étudiants pour les postes d’interne, (2) les facteurs qui caractérisent les spécialités, (3) les mesures comportementales déclaratives (patience, aversion au risque, goût pour la compétition) et (4) des informations supplémentaires recueillies sur le réseau des étudiants (les étudiants avaient en effet la possibilité d’indiquer leur liens d’affinité avec d’autres étudiants de la promotion (révisions, contacts en dehors de l’université).Objectifs
L’objectif de ce projet de recherche est d’évaluer plus particulièrement le rôle joué par les pairs dans la décision du choix de postes d’interne (spécialité+ subdivision).
Méthodes proposées
L’objectif sera de définir et d’appliquer deux types d’approches permettant d’expliquer et de prédire le choix de postes d’internes par les étudiants en évaluant en particulier l’influence éventuelle de son réseau.
Les deux familles de méthodes envisagées sont :
– Des méthodes statistiques et économétriques adaptées à la prise en compte du réseau de l’étudiant sur le choix de poste d’interne (spécialité+subdivision). Nous adapterons le modèle linéaire en moyenne des effets des pairs pour établir le réseau des étudiants de médecine.
– Des méthodes d’apprentissage de règles supervisées dans les données graphe représentant les individus et leurs liens d’affinités. Ces règles devront permettre de prédire un choix de poste d’interne en fonction de ces informations ou de groupes d’individus identifiés par des méthodes de fouille de graphes.
La fin du stage sera consacrée à l’analyse et à la comparaison des résultats obtenus par chacune des méthodes.
Cadre de travail
Ce stage est co-encadré par des scientifiques issus de deux laboratoires. Le LIPN sera le laboratoire d’accueil principal du stagiaire. Le stagiaire sera également amené à se déplacer au laboratoire EconomiX à l’Université Paris Nanterre.
Compétences recherchées
Nous recherchons un étudiant niveau BAC+5 en informatique, ou mathématiques appliquées avec une double compétence en informatique et en statistiques. Des compétences en apprentissage symbolique seront un plus. L’étudiant devra être motivé par les aspects interdisciplinaires du stage.
Pour candidater
Les dossiers de candidature sont à transmettre à Nathalie Pernelle et Céline Rouveirol au moyen d’une archive .zip contenant :
• un curriculum vitae,
• les relevés de notes des années 2021-22 et 2022-23,
• une lettre de motivation
• les contacts (qualité, adresse mail, téléphone) de un ou deux référents.
Références bibliographiques
[1] Lucas Simonne, Nathalie Pernelle, Fatiha Saïs, Rallou Thomopoulos: Differential Causal Rules Mining in Knowledge Graphs. K-CAP 2021: 105-112, 2021.
[2] Henry Soldano, Guillaume Santini, Dominique Bouthinon, Sophie Bary, Emmanuel Lazega: Bi-pattern mining of attributed networks. Appl. Netw. Sci. 4(1): 37:1-37:26 (2019)
[3] Bramoullé Y. et al. Identification of peer effects through social networks, J. Econom, Vol. 150, p. 41-55, 2009.
[4] Bramoullé Y. et al. Peer effects in networks: A survey, Annual Review of Economics, Vol. 12, p. 603-629, 2020.