Coup de projecteur sur la phraséologie informatique et la phraséologie basée sur les corpus à Europhras 2019

Du 25 au 27 septembre 2019, un collègue de l’équipe de terminologie du Centre a assisté à la Conférence internationale «Phraséologie informatique et phraséologie basée sur les corpus» (Europhras 2019) à Málaga (Espagne) et a pris connaissance des dernières approches informatisées de la phraséologie.

Le programme de ces trois jours comprenait des exposés sur divers sujets interdisciplinaires. Il a notamment été question d’approches psycholinguistiques et cognitives basées sur les corpus pour l’étude de la phraséologie, du traitement informatique des expressions à mots multiples, ainsi que de leurs applications pratiques dans les domaines de la traduction, de la lexicographie et de l’apprentissage des langues, de leur enseignement et de l’évaluation des compétences linguistiques.

Quatre orateurs de renommée internationale ont présenté de nouvelles recherches sur la phraséologie informatique.

Miloš Jakubíček, PDG de Lexical Computing et développeur du logiciel SketchEngine, a fait un exposé sur les méthodes automatiques d’extraction d’expressions à mots multiples, fondées sur des propriétés standard telles que la fixité et la mesure dans laquelle un élément composé de plusieurs mots est figé sous la forme d’une séquence de mots.

Aline Villavicencio, professeure au département d’informatique de l’Université de Sheffield (Royaume-Uni), a fait le point sur les progrès accomplis dans la reconnaissance des expressions à mots multiples, sur la base des différents degrés de particularités qu’elles présentent, y compris les informations lexicales, syntaxiques, sémantiques et statistiques.

Natalie Kübler, professeure de traduction et de linguistique spécialisées à usage spécifique à l’Université Paris Diderot, a expliqué comment la recherche et la pratique ont évolué dans les études de traduction spécialisée, du fait d’une attention accrue portée à la traduction basée sur les corpus théoriques.

Ruslan Mitkov, professeur à l’Université de Wolverhampton (Royaume-Uni), est un spécialiste renommé du traitement automatique du langage naturel. Il a dirigé la publication du Oxford Handbook of Computational Linguistics (Oxford University Press) et est rédacteur en chef du Journal of Natural Language Engineering (Cambridge University Press). Le professeur Mitkov a fait un exposé intéressant sur la traduction automatique d’expressions à mots multiples à l’aide de corpus comparables.

La conférence EUROPHRAS 2019 a également accueilli le quatrième atelier sur les unités à mots multiples dans la traduction automatique et les technologies de traduction (MUMTTT 2019), qui visait à réunir des chercheurs travaillant sur des approches de traitement automatique du langage naturel fondées sur le traitement informatique des unités à mots multiples.

Tous les participants à la conférence ont pu se rendre compte que les données phraséologiques sont désormais plus disponibles qu’elles ne l’avaient jamais été auparavant grâce aux nouvelles technologies basées sur les corpus et aux nouveaux algorithmes basés sur les techniques informatiques permettant de reconnaître les groupes qui constituent des expressions à mots multiples. Les corpus continueront de s’étoffer au cours des prochaines années et les études de phraséologie doivent tirer parti de cette approche. L’un des principaux défis à relever dans le domaine de la traduction automatique reste lié à la reconnaissance de la phraséologie, de manière à éviter la traduction littérale résultant de l’analyse des expressions compositionnelles dans le texte source. Il est donc crucial que les linguistes et les informaticiens concentrent leurs efforts sur l’étude et la reconnaissance des expressions à mots multiples afin de permettre leur identification automatique dans des corpus de grande ampleur.

De plus amples informations sur EUROPHRAS 2019 sont disponibles à l’adresse suivante:

http://www.lexytrad.es/europhras2019/