Brochure du symposium «Espagne et science»

Le deuxième symposium international «Espagne et science» a eu lieu en mars dernier à Rome. Il était organisé par ASIERI, l’association des chercheurs espagnols de la République italienne. Le Centre de traduction était représenté par Anna Samiotou, membre de la section «Solutions linguistiques avancées», qui a présenté les progrès et les défis liés à l’utilisation de la traduction automatique grâce à l’intelligence artificielle au Centre.

Body

Cet événement hybride s’adressait à la communauté scientifique et universitaire, aux dirigeants institutionnels, traducteurs, linguistes, experts en technologies du langage, journalistes scientifiques, enseignants et étudiants hispanophones. Il a offert une vue d’ensemble des efforts déployés par les professionnels scientifiques, universitaires, institutionnels et œuvrant dans ce secteur pour promouvoir la position et la visibilité de la langue espagnole dans le domaine des sciences et des technologies à l’échelle internationale.

Si l’anglais constitue la lingua franca du monde des sciences et des technologies, les textes rédigés dans la langue maternelle de leurs auteurs offrent généralement davantage de profondeur, de cohérence et de clarté. En outre, étant donné que l’utilisation d’une langue donnée dans les applications d’intelligence artificielle (IA) et les outils de technologie du langage peut influencer l’évolution de ladite langue, et compte tenu du pouvoir des mots sur la façon de penser et de se sentir, le recours à des stratégies scientifiques et technologiques communes à diverses communautés linguistiques contribuerait à ce que celles-ci prennent le contrôle sur l’évolution de la langue.

Dans le cas de l’espagnol, les efforts visant à promouvoir son utilisation dans les sciences et les technologies consistent notamment à favoriser un accès ouvert et facile aux publications scientifiques, à encourager la participation active des organisations et à les encourager à opérer leur transformation numérique et leur interopérabilité, à promouvoir des stratégies et des synergies nationales et internationales communes, à développer le réseau de locuteurs natifs.

Le symposium a accueilli des présentations sur les données linguistiques, les types de données et leur utilisation dans les applications d’IA, avec des références aux données ouvertes, aux données liées, aux espaces de données, aux lacs de données, à la gouvernance des données, à l’origine des données, au cycle des données, au marché des données, à l’économie des données, ainsi qu’aux initiatives de source ouverte connexes, telles que les principes FAIR, qui font référence à un ensemble d’attributs qui permettent et facilitent le fait que les données soient plus faciles à trouver, accessibles, interopérables et réutilisables tant pour les machines que pour les êtres humains. Les présentations ont également porté sur les thèmes suivants: la pyramide DICS, représentant les relations entre les données, les informations, les connaissances et la sagesse; BabelNet, un réseau multilingue de connaissances sémantiques et de ressources lexicales, intégrant des informations provenant de diverses sources telles que WordNet avec Wikipédia; et oLDS, l’initiative européenne commune en matière d’espace de données linguistiques visant à créer une plateforme et un marché pour la collecte, la création, le partage et la réutilisation de données linguistiques multilingues et multimodales.

Le Centre de traduction était représenté par Anna Samiotou, membre de la section «Solutions linguistiques avancées», qui a présenté un exposé sur les progrès et défis liés à l’utilisation de la technologie de traduction automatique neuronale (NMT) rendue possible par l’IA au Centre. Ces solutions peuvent s’appliquer à toutes les langues traduites par le Centre de différentes manières, le but étant d’améliorer à la fois les performances du système et la qualité des traductions automatiques. Compte tenu de la priorité accordée à la langue espagnole dans le cadre de cet événement, l’intervenant a cité des exemples spécifiques de difficultés concernant l’espagnol. Il s’agissait notamment des pratiques de prétraitement et de post-traitement, de la manière dont les réseaux neuronaux artificiels peuvent améliorer leurs prédictions et de la valeur ajoutée d’une intervention humaine, qui fournit un retour d’informations continu et précieux tout en contribuant à l’obtention de résultats plus efficaces. L’avènement des grands modèles linguistiques (LLM) et de la technologie de l’IA générative pose de nouveaux défis et représente un potentiel d’amélioration des services linguistiques du Centre grâce à l’innovation.