Annonce

Les commentaires sont clos.

Focalisation prosodique dans les corpus oraux : apport du traitement du signal et de l’apprentissage machine pour leur repérage

14 Janvier 2022


Catégorie : Stagiaire


Proposition de stage de Master 2 ou de fin d'études d'ingénieur en traitement du signal et apprentissage machine pour le repérage des focalisations prosodiques dans les corpus oraux.

La candidat doit avoir une formation en traitement du signal et apprentuissage machine avec un intérêt pour les signaux de parole audio.

Le stage est localisé à Orléans, gratification d'environ 550€ / mois, début en mars pour 5 à 6 mois

Pour toutes demande d’informations complémentaires, contacter philippe.ravier@univ-orleans.fr

 

Contexte :

La mise en relief de certains éléments d’un énoncé détermine l’interprétation sémantique et pragmatique dans la phrase correspondante. Cette mise en relief est objectivée par des marqueurs d’attention (saillance), qui dans le cas des corpus oraux, se limite à quelques traits prosodiques [1]. L’originalité du sujet est d’explorer l’apport du traitement du signal et des autres communautés travaillant sur la saillance [2] pour identifier de nouveaux traits prosodiques pertinents pour le repérage des occurrences de focalisation prosodique dans des corpus oraux, en association avec les approches d’apprentissage machine actuelles.

Ce travail de stage s’inscrit dans le cadre des collaborations entretenues entre le laboratoire PRISME1, le laboratoire LLL2 et le laboratoire LIFO3 de l’université d’Orléans par les projets Diasémie4 et Ravioli5. Ces collaborations ont permis de développer une expertise sur la caractérisation prosodique des énoncés à des fins de détection ou classification automatique de conviction [3, 4, 5] ou d’injonction [6]. Nous nous intéresserons dans le cadre de ce stage à la caractérisation prosodique pour le repérage des focalisations prosodiques. Ceci pourra se faire au moyen des nouveaux traits prosodiques identifiés, associés à un apprentissage machine ou au moyen d’un apprentissage machine profond, qui a montré son intérêt lors du précédent stage RTR Diams (travail soumis à la Conférence ICPRAM : Deep learning for injunction vs no-injunction classification of French spontaneous oral speech).

Travail demandé :

Une première tâche est une étude bibliographique sur les traits utilisés en linguistique pour la focalisation prosodique, ainsi que sur les marqueurs de saillance utilisés dans d’autres domaines.

Une deuxième tâche sera le développement d’un système automatique de repérage des occurrences de focalisation prosodique, par apprentissage d’un ensemble des occurrences identifiées par les experts linguistes. Ce système pourra être hybride, avec apprentissage profond ou non, avec aussi pour objectif l’évaluation de la pertinence des marqueurs.

La troisième tâche sera la confrontation de ce système à un corpus oral de grande ampleur, celui de Ravioli, ainsi que d’un corpus en constitution de lecture aux enfants du LLL.

Environnement de réalisation :

Le stage est localisé au laboratoire PRISME, Université d’Orléans, encadrant Philippe Ravier (philippe.ravier@univ-orleans.fr), co-encadrante Sylvie Billot du LIFO (sylvie.billot@univ-orleans.fr) et le ou la stagiaire percevra une indemnité forfaitaire d’environ 550€ / mois. La collaboration avec le LLL se fera par l’intermédiaire de Lotfi Abouda (lotfi.abouda@univ-orleans.fr) et de François Nemo (francois.nemo@univ-orleans.fr).

 

Références bibliographiques

1.R. GODEMENT-BERLINE,

Contribution à l'étude de la focalisation prosodique en français,

Actes de la conférence conjointe JEP-TALN-RECITAL, pp. 164-172, 2016.

2.F. Landragin,

De la saillance visuelle à la saillance linguistique,

Saillance. Aspects linguistiques et communicatifs de la mise en évidence dans un texte, Presses Universitaires de Franche-Comté, pp.67-84, 2011, Annales Littéraires de l’Université de Franche-Comté.

3.A. Hacine-Gharbi, M. Petit, P. Ravier, F. Nemo,

Prosody Based Automatic Classification of the Uses of French ‘oui’ as Convinced or Unconvinced Uses,

4th International Conference on Pattern Recognition Applications and Methods, ICPRAM, pp. 349-354, Lisbonne, Portugal, 10-12 January, 2015.

https://doi.org/10.5220/0005293103490354

4.A. HACINE-GHARBI, P. Ravier, F. NEMO,

Local and Global Feature Selection for Prosodic Classification of the Word’s Uses,

6th International Conference on Pattern Recognition Applications and Methods, ICPRAM, pp. 711-717, Porto, Portugal, February 2017.

https://doi.org/10.5220/0006251407110717

5.A. HACINE-GHARBI, P. Ravier,

Automatic classification of French spontaneous oral speech into injunction and no-injunction classes,

9th International Conference on Pattern Recognition Applications and Methods, ICPRAM, La Valetta, Malta, February 2020.

6.A. BOUGRINE, P. RAVIER, A. HACINE-GHARBI, H. OUACHOUR

LSTM Network based on Prosodic Features for the Classification of Injunction in French Oral Utterances,

11th International Conference on Pattern Recognition Applications and Methods, ICPRAM, Vienna, Austria, (virtual) February 2022.

 



[1] Laboratoire Pluridisciplinaire de Recherche en Ingénierie des Systèmes, Mécanique, Energétique

[2] Laboratoire Ligérien de Linguistique

[3] Laboratoire d’Informatique Fondamentale d’Orléans

[4] Discrimination Automatique des Sens d’Emploi des Mots par l’Intonation

[5]Reconnaissance Automatique des Valeurs Injonctives à l’Oral, Langue en Interaction