Sorbonne Université

Contact : Taraneh SAYADI taraneh.sayadi@sorbonne-universite.fr
Début souhaité de la thèse : janvier 2023.
Remarques : Le projet utilise EDNN (réseaux de neurones profonds évolutifs) pour la résolution d’équations aux dérivées partielles de grande dimension (résumé ci-dessous). Le projet est en collaboration avec le professeur Zaki à Johns Hopkins, avec un financement inclus pour les séjours dans l’institution américaine.

Machine-learning (ML) holds significant promise in revolutionizing a wide range of applications, in particular in the domain of multi-scale and multi-physics problems. Success in realizing the promise of ML is predicated on the availability of training data, which are often obtained from scientific computations. Conventional approaches to solving the equations of physics require difficult and specialized software development, grid generation and adaptation, and the use of specialized data and software pipelines that differ from those adopted in ML. A disruptive new approach that was recently proposed by the US team is Evolutional Deep Neural Networks (EDNN, pronounced “Eden”) which leverages the software and hardware infrastructure used in ML to replace conventional computational methods, and to tackle their shortcomings. EDNN is unique because it does not rely on training to express known solutions, but rather the network parameters \emph{evolve} using the governing physical laws such that the network can \emph{predict} the evolution of the physical system. In the proposed effort, we will develop the EDNN framework to solve high-dimensional partial differential equations, used to model a vast range of phenomena in economics, finance, operational research, and multi-phase fluid dynamics, where population balance equations govern phenomena as diverse as aerosol transmission of airborne pathogens or mixing enhancement in energy conversion devices. The simulation of such flows is an open issue of particular interest to the US and French teams, a strong motivation for the proposed collaboration. We will demonstrate the ease of software development using automatic differentiation tools and the capacity of EDNN to eliminate the \emph{curse of dimensionality} and the tyranny of \emph{moment closure}. Success stands to disrupt and transform the decades-old computational approach to solving nonlinear differential equations and to remove the barriers to generation of training data required for ML.

ESPCI

The ANR project E-SSL (Efficient Self-Supervised Learning for Inclusive and Innovative Speech Technologies) will start on November 1st. Self-supervised learning (SSL) has recently emerged as one of the most promising artificial intelligence (AI) methods as it becomes now feasible to take advantage of the colossal amounts of existing unlabeled data to significantly improve the results of various systems.

Speech technologies are widely used in our daily life and are expanding the scope of our action, with decision-making systems, including in critical areas such as health or legal aspects. In these societal applications, the question of the use of these tools raises the issue of the possible discrimination of people according to criteria for which society requires equal treatment, such as gender, origin, religion or disability…  Recently, the machine learning community has been confronted with the need to work on the possible biases of algorithms, and many works have shown that the search for the best performance is not the only goal to pursue [1]. For instance, recent evaluations of ASR systems have shown that performances can vary according to the gender but these variations depend both on  data used for learning and on models [2]. Therefore such systems are increasingly scrutinized for being biased while trustworthy speech technologies definitely represents a crucial expectation.

Both the question of bias and the concept of fairness have now become important aspects of AI, and we now have to find the right threshold between accuracy and the measure of fairness. Unfortunately, these notions of fairness and bias are challenging to define and theirmeanings can greatly differ [3].

The goals of this PhD position are threefold:
– First make a survey on the many definitions of robustness,  fairness and bias with the aim of coming up with definitions and  metrics fit for speech SSL models
– Then gather speech datasets with high amount of well-described  metadata
– Setup an evaluation protocol for SSL models and analyzing the  results. The PhD position will be co-supervised by Alexandre Allauzen (Dauphine Université PSL, Paris) and Solange Rossato and François Portet (Université Grenoble Alpes). Joint meetings are planned on a regular basis and the student is expected to spend time in both places. Moreover, two other PhD positions are open in this project.  The students, along with the partners will closely collaborate. For instance, specific SSL models along with evaluation criteria will be developed by the other PhD students.


Skills
– Master 2 in Natural Language Processing, Speech Processing,  computer science or data science.
– Good mastering of Python programming and  deep learning  framework.
– Previous experience in Self-Supervised Learning, acoustic  modeling or ASR would be a plus
– Very good communication skills in English
– Good command of French would be a plus but is not mandatory 
To apply, send a CV and a cover letter to A. Allauzen before September the 12th


[1] Mengesha, Z., Heldreth, C., Lahav, M., Sublewski, J. & Tuennerman, E. “I don’t Think These Devices are Very Culturally Sensitive.”—Impact of Automated Speech Recognition Errors on African Americans. Frontiers in Artificial Intelligence 4. issn: 2624-8212. https://www.frontiersin.org/article/10.3389/frai.2021.725911(2021).
[2] Garnerin, M., Rossato, S. & Besacier, L. Investigating the Impact  of Gender Representation in ASR Training Data: a Case Study on Librispeech in Proceedings of the 3rd Workshop on Gender Bias in Natural Language Processing (2021), 86–92.[3] Mehrabi, N., Morstatter, F., Saxena, N., Lerman, K. & Galstyan, A. A Survey on Bias and Fairness in Machine Learning.  ACMComput. Surv. 54. issn: 0360-0300. https://doi.org/10.1145/3457607 (July 2021).

-- 
Vous recevez cet email car vous etes abonne.e a la liste "ssfam".
Pour vous desabonner, merci de cliquer sur ce lien : https://framalistes.org/sympa/sigrequest/ssfam
ou d'envoyer un mail a sympa@framalistes.org avec comme sujet "unsubscribe ssfam"

You receive this email since you subscribed to the list "ssfam".
To unsubscribe, click on following link: https://framalistes.org/sympa/sigrequest/ssfam
or send an email to sympa@framalistes.org with the subject: unsubscribe ssfam

INRIA Lille

We are URGENTLY looking for a student motivated by advancing Reinforcement  Learning theory, starting this fall for a three year PhD program in research our group Inria Scool, Lille, France https://team.inria.fr/scool/
The topic is about “Real-life Challenges for Reinforcement Learning Theory”, the supervisor is  Odalric-Ambrym Maillard, the funding comes from a Chaire of AI program with increased salary. Other permanent researchers of the team include Philippe Preux,  Emilie KaufmannRémy DegenneDebabrota Basu, and Riad Akrour. Full member list can be found at https://team.inria.fr/scool/team-members/
Inria Scool is an active research team in reinforcement learning theory,  interested in applications related to health-care, personalized medicine and agroecology, to cite a few. Odalric-Ambrym Maillard is also co-heading the Inria-Japan “Reliant” associate team with Junya Honda from Kyoto University to foster scientific exchange. 
News: We just received no less than three new four-year projects funded by the national research agency (ANR) on various aspects of fundamental and applied RL. 

For students: If you are interested to be part of a scientific thrilling research team, please contact directly odalric.maillard@inria.fr with CV, 1 reco lettter and motivation letter.For researchers: please forward this to any talented student looking for a PhD in RL.

Université de Lyon

Contexte :

Actuellement l’intelligence artificielle (IA) et les réseaux de neurones font l’objet de nombreux développements tant dans les grands groupes industriels (Google, Intel, Microsoft) que dans les laboratoires. De nombreuses voies sont explorées, principalement au niveau serveur ou large infrastructure ce qui permet de gérer des réseaux neuronaux à très grand nombres de couches. Cependant, de nombreuses recherches ont aussi pour vocation à délocaliser une partie des calculs au sein même du capteur. C’est le “Edge Computing” qui décrit le fait de rapprocher le traitement des données auprès du système les générant. Par essence, cela s’oppose au “Cloud Computing” où le traitement est centralisé et réalisé dans un système central et distant (dans le cloud) imposant des communications bidirectionnelles coûteuses en temps et en traitement. Un des inconvénients majeurs du “cloud-computing” est la potentielle violation de la vie privée (privacy) puisque les données sont intégralement transférées sans le contrôle de l'individu. De nouvelles lois, comme [GDPR16], sont apparues pour limiter très fortement l'utilisation de telles techniques. L’approche “Edge” permet, en amenant une partie du calcul au plus près de la source des données, de répondre à cet inconvénient en ne fournissant au cloud que des informations sur la donnée capturée. Cette approche permet également de tendre vers un traitement de données temps réel en réduisant les problèmes de bande passante et de latence, ce qui se traduit par de meilleures performances et une réduction des coûts d'exploitation des applications à forte intensité de données. Cela est d’autant plus prégnant lorsque les données d’entrée sont des images. Il est donc facile de comprendre que dans un contexte alliant intelligence artificielle donc calculs lourds et traitement de données “images”, des solutions basées sur la distribution des traitement sont les plus ad-hoc. Cette approche que l’on peut nommer Edge-AI va permettre d’exécuter des algorithmes de traitement à base d’intelligence
artificielle au cœur même des appareils qui font partie du réseau "Edge Computing", en ayant recours à une connexion internet de manière raisonnable.

Objectif :

L'objectif de cette thèse est de proposer des solutions novatrices aux problématiques de réseaux de capteurs d’images intelligents (smart vision sensors), notamment l'’intégration d’une intelligence collective au sein du réseau à partir de données élémentaires pré-traitées sur les nœuds de calcul.
Toutes les méthodes d’IA pour l’image les plus éprouvées à ce jour sont basées sur des CNN (Convolutional Neural Network). Une étape principale de la thèse est de concevoir des architectures de CNN déployables sur des réseaux de capteurs ainsi que de proposer de nouvelles méthodes d’apprentissage distribué de CNN Cela implique :
• une mutualisation éventuelle d’une partie du CNN entre les différents nœuds en assurant la vie privée et en optimisant les ressources (calcul, mémoire, communications réseau, donc la consommation d’énergie): Cela permettrait également de "personnaliser" les traitements locaux en fonction des services.
• une construction d’un modèle CNN global performant avec des données de capteurs locaux sans transmission d’informations sensibles et en limitant le volume et la fréquence des échanges.
Ces algorithmes et modèles s'appuieront sur des techniques récentes en IA en proposant de nouvelles contributions scientifiques et techniques dans le contexte du Edge Computing. De plus, les approches innovantes d’apprentissage automatique seront considérées pour permettre la construction efficace du modèle: apprentissage de représentation, apprentissage semi supervisé et continu.
L’objectif de ces recherches plus fondamentaux sur l’IA et le “Edge Computing” est d’appliquer ses résultats à un ou plusieurs cas d’études réels dans le domaine de vision par ordinateur (par exemple, la détection et le suivi d’objets ou de personnes ou la reconnaissance de gestes dans un flux vidéo) et éventuellement de créer un prototype sur carte FPGA.


Environnement :

La thèse est dirigée par Stefan Duffner du laboratoire LIRIS à Lyon (INSA Lyon), équipe Imagine, et Virginie Fresse du Laboratoire Hubert Curien (LabHC) à Saint Étienne (Université Jean Monnet), équipe Image Science & Computer Vision.
Elle est financée par la région Auvergne Rhône-Alpes dans le cadre du projet ARTIstE (ARTificial Intelligence on the Edge) entre le CEA, l'Université Grénoble-Alpes, l'Université de Clermont-Auvergne, l'Université de Lyon et l'Université Jean Monnet.

La thèse se déroulera principalement à Lyon.

Merci d'adresser votre candidature avec CV et bulletins de notes à :

stefan.duffner@liris.cnrs.fr
virginie.fresse@univ-st-etienne.fr