ESPCI

The ANR project E-SSL (Efficient Self-Supervised Learning for Inclusive and Innovative Speech Technologies) will start on November 1st. Self-supervised learning (SSL) has recently emerged as one of the most promising artificial intelligence (AI) methods as it becomes now feasible to take advantage of the colossal amounts of existing unlabeled data to significantly improve the results of various systems.

Speech technologies are widely used in our daily life and are expanding the scope of our action, with decision-making systems, including in critical areas such as health or legal aspects. In these societal applications, the question of the use of these tools raises the issue of the possible discrimination of people according to criteria for which society requires equal treatment, such as gender, origin, religion or disability…  Recently, the machine learning community has been confronted with the need to work on the possible biases of algorithms, and many works have shown that the search for the best performance is not the only goal to pursue [1]. For instance, recent evaluations of ASR systems have shown that performances can vary according to the gender but these variations depend both on  data used for learning and on models [2]. Therefore such systems are increasingly scrutinized for being biased while trustworthy speech technologies definitely represents a crucial expectation.

Both the question of bias and the concept of fairness have now become important aspects of AI, and we now have to find the right threshold between accuracy and the measure of fairness. Unfortunately, these notions of fairness and bias are challenging to define and theirmeanings can greatly differ [3].

The goals of this PhD position are threefold:
– First make a survey on the many definitions of robustness,  fairness and bias with the aim of coming up with definitions and  metrics fit for speech SSL models
– Then gather speech datasets with high amount of well-described  metadata
– Setup an evaluation protocol for SSL models and analyzing the  results. The PhD position will be co-supervised by Alexandre Allauzen (Dauphine Université PSL, Paris) and Solange Rossato and François Portet (Université Grenoble Alpes). Joint meetings are planned on a regular basis and the student is expected to spend time in both places. Moreover, two other PhD positions are open in this project.  The students, along with the partners will closely collaborate. For instance, specific SSL models along with evaluation criteria will be developed by the other PhD students.


Skills
– Master 2 in Natural Language Processing, Speech Processing,  computer science or data science.
– Good mastering of Python programming and  deep learning  framework.
– Previous experience in Self-Supervised Learning, acoustic  modeling or ASR would be a plus
– Very good communication skills in English
– Good command of French would be a plus but is not mandatory 
To apply, send a CV and a cover letter to A. Allauzen before September the 12th


[1] Mengesha, Z., Heldreth, C., Lahav, M., Sublewski, J. & Tuennerman, E. “I don’t Think These Devices are Very Culturally Sensitive.”—Impact of Automated Speech Recognition Errors on African Americans. Frontiers in Artificial Intelligence 4. issn: 2624-8212. https://www.frontiersin.org/article/10.3389/frai.2021.725911(2021).
[2] Garnerin, M., Rossato, S. & Besacier, L. Investigating the Impact  of Gender Representation in ASR Training Data: a Case Study on Librispeech in Proceedings of the 3rd Workshop on Gender Bias in Natural Language Processing (2021), 86–92.[3] Mehrabi, N., Morstatter, F., Saxena, N., Lerman, K. & Galstyan, A. A Survey on Bias and Fairness in Machine Learning.  ACMComput. Surv. 54. issn: 0360-0300. https://doi.org/10.1145/3457607 (July 2021).

-- 
Vous recevez cet email car vous etes abonne.e a la liste "ssfam".
Pour vous desabonner, merci de cliquer sur ce lien : https://framalistes.org/sympa/sigrequest/ssfam
ou d'envoyer un mail a sympa@framalistes.org avec comme sujet "unsubscribe ssfam"

You receive this email since you subscribed to the list "ssfam".
To unsubscribe, click on following link: https://framalistes.org/sympa/sigrequest/ssfam
or send an email to sympa@framalistes.org with the subject: unsubscribe ssfam

INRIA Lille

We are URGENTLY looking for a student motivated by advancing Reinforcement  Learning theory, starting this fall for a three year PhD program in research our group Inria Scool, Lille, France https://team.inria.fr/scool/
The topic is about “Real-life Challenges for Reinforcement Learning Theory”, the supervisor is  Odalric-Ambrym Maillard, the funding comes from a Chaire of AI program with increased salary. Other permanent researchers of the team include Philippe Preux,  Emilie KaufmannRémy DegenneDebabrota Basu, and Riad Akrour. Full member list can be found at https://team.inria.fr/scool/team-members/
Inria Scool is an active research team in reinforcement learning theory,  interested in applications related to health-care, personalized medicine and agroecology, to cite a few. Odalric-Ambrym Maillard is also co-heading the Inria-Japan “Reliant” associate team with Junya Honda from Kyoto University to foster scientific exchange. 
News: We just received no less than three new four-year projects funded by the national research agency (ANR) on various aspects of fundamental and applied RL. 

For students: If you are interested to be part of a scientific thrilling research team, please contact directly odalric.maillard@inria.fr with CV, 1 reco lettter and motivation letter.For researchers: please forward this to any talented student looking for a PhD in RL.

Université de Lyon

Contexte :

Actuellement l’intelligence artificielle (IA) et les réseaux de neurones font l’objet de nombreux développements tant dans les grands groupes industriels (Google, Intel, Microsoft) que dans les laboratoires. De nombreuses voies sont explorées, principalement au niveau serveur ou large infrastructure ce qui permet de gérer des réseaux neuronaux à très grand nombres de couches. Cependant, de nombreuses recherches ont aussi pour vocation à délocaliser une partie des calculs au sein même du capteur. C’est le “Edge Computing” qui décrit le fait de rapprocher le traitement des données auprès du système les générant. Par essence, cela s’oppose au “Cloud Computing” où le traitement est centralisé et réalisé dans un système central et distant (dans le cloud) imposant des communications bidirectionnelles coûteuses en temps et en traitement. Un des inconvénients majeurs du “cloud-computing” est la potentielle violation de la vie privée (privacy) puisque les données sont intégralement transférées sans le contrôle de l'individu. De nouvelles lois, comme [GDPR16], sont apparues pour limiter très fortement l'utilisation de telles techniques. L’approche “Edge” permet, en amenant une partie du calcul au plus près de la source des données, de répondre à cet inconvénient en ne fournissant au cloud que des informations sur la donnée capturée. Cette approche permet également de tendre vers un traitement de données temps réel en réduisant les problèmes de bande passante et de latence, ce qui se traduit par de meilleures performances et une réduction des coûts d'exploitation des applications à forte intensité de données. Cela est d’autant plus prégnant lorsque les données d’entrée sont des images. Il est donc facile de comprendre que dans un contexte alliant intelligence artificielle donc calculs lourds et traitement de données “images”, des solutions basées sur la distribution des traitement sont les plus ad-hoc. Cette approche que l’on peut nommer Edge-AI va permettre d’exécuter des algorithmes de traitement à base d’intelligence
artificielle au cœur même des appareils qui font partie du réseau "Edge Computing", en ayant recours à une connexion internet de manière raisonnable.

Objectif :

L'objectif de cette thèse est de proposer des solutions novatrices aux problématiques de réseaux de capteurs d’images intelligents (smart vision sensors), notamment l'’intégration d’une intelligence collective au sein du réseau à partir de données élémentaires pré-traitées sur les nœuds de calcul.
Toutes les méthodes d’IA pour l’image les plus éprouvées à ce jour sont basées sur des CNN (Convolutional Neural Network). Une étape principale de la thèse est de concevoir des architectures de CNN déployables sur des réseaux de capteurs ainsi que de proposer de nouvelles méthodes d’apprentissage distribué de CNN Cela implique :
• une mutualisation éventuelle d’une partie du CNN entre les différents nœuds en assurant la vie privée et en optimisant les ressources (calcul, mémoire, communications réseau, donc la consommation d’énergie): Cela permettrait également de "personnaliser" les traitements locaux en fonction des services.
• une construction d’un modèle CNN global performant avec des données de capteurs locaux sans transmission d’informations sensibles et en limitant le volume et la fréquence des échanges.
Ces algorithmes et modèles s'appuieront sur des techniques récentes en IA en proposant de nouvelles contributions scientifiques et techniques dans le contexte du Edge Computing. De plus, les approches innovantes d’apprentissage automatique seront considérées pour permettre la construction efficace du modèle: apprentissage de représentation, apprentissage semi supervisé et continu.
L’objectif de ces recherches plus fondamentaux sur l’IA et le “Edge Computing” est d’appliquer ses résultats à un ou plusieurs cas d’études réels dans le domaine de vision par ordinateur (par exemple, la détection et le suivi d’objets ou de personnes ou la reconnaissance de gestes dans un flux vidéo) et éventuellement de créer un prototype sur carte FPGA.


Environnement :

La thèse est dirigée par Stefan Duffner du laboratoire LIRIS à Lyon (INSA Lyon), équipe Imagine, et Virginie Fresse du Laboratoire Hubert Curien (LabHC) à Saint Étienne (Université Jean Monnet), équipe Image Science & Computer Vision.
Elle est financée par la région Auvergne Rhône-Alpes dans le cadre du projet ARTIstE (ARTificial Intelligence on the Edge) entre le CEA, l'Université Grénoble-Alpes, l'Université de Clermont-Auvergne, l'Université de Lyon et l'Université Jean Monnet.

La thèse se déroulera principalement à Lyon.

Merci d'adresser votre candidature avec CV et bulletins de notes à :

stefan.duffner@liris.cnrs.fr
virginie.fresse@univ-st-etienne.fr