Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d'enfant

LB Medin, L Gelin, T Pellegrini - … 35èmes Journées d'Études sur la …, 2024 - inria.hal.science
La reconnaissance de parole d'enfant est un domaine de recherche encore peu développé
en raison du manque de données et des difficultés caractéristiques de cette tâche. Après …

Implémentation ouverte et étude de BEST-RQ pour le traitement de la parole

R Whetten, T Parcollet, M Dinarelli… - Actes des 35èmes …, 2024 - aclanthology.org
L'apprentissage auto-supervisé (SSL) a fait ses preuves pour le traitement automatique de
la parole mais est généralement très consommateur de données, de mémoire et de …

De nouvelles méthodes pour l'exploration de l'interface syntaxe-prosodie: un treebank intonosyntaxique et un système de synthèse pour le pidgin nigérian

E Strickland, A Lacheret, M Evrard… - Actes de la 31ème …, 2024 - aclanthology.org
Cet article présente deux ressources récemment développées pour explorer l'interface
prosodie-syntaxe en pidgin nigérian, une langue à faibles ressources d'Afrique de l'Ouest …

Approches cascade et de bout-en-bout pour la traduction automatique de la parole en pictogrammes

C Macaire, C Dion, D Schwab… - Actes de JEP-TALN …, 2024 - inria.hal.science
La traduction automatique de la parole en pictogrammes (Parole-à-Pictos) est une nouvelle
tâche du Traitement Automatique des Langues (TAL) ayant pour but de proposer une …

Les représentations de locuteurs pour prédire l'intelligibilité de la parole lors de conversations médicales

S Quintas, M Balaguer, J Mauclair… - Actes de JEP-TALN …, 2024 - inria.hal.science
Dans le contexte des troubles de la parole, l'une des tâches du thérapeute est de définir
l'intelligibilité de la parole du patient. Les systèmes automatiques peuvent aider dans cette …

Une approche par graphe pour l'analyse syntaxique en dépendances de bout en bout de la parole

A Pupier, M Coavoux, B Lecouteux… - Actes de JEP-TALN …, 2024 - inria.hal.science
Effectuer l'analyse syntaxique du signal audio–plutôt que de passer par des transcriptions
de l'audio–est une tache récemment proposée par Pupier et al.(2022), dans le but …

Un paradigme pour l'interprétation des métriques et pour mesurer la gravité des erreurs de reconnaissance automatique de la parole

T Bañeras-Roux, M Rouvier, J Wottawa… - Actes de JEP-TALN …, 2024 - inria.hal.science
Les mesures couramment employées pour l'évaluation des transcriptions automatiques de
la parole, telles que le taux d'erreur-mot (WER) et le taux d'erreur-caractère (CER), ont fait …