Dans l’univers de l’intelligence artificielle, la traduction automatique est une branche qui a connu des avancées fulgurantes au cours des dernières années.
Grâce au traitement automatique des langues (TAL), plus couramment appelé « NLP » pour l’anglais « Natural Language Processing », les machines peuvent désormais comprendre et traduire le langage humain avec une précision déconcertante.
L’intégration du NLP à la traduction automatique a changé la donne et a rendu possible la communication au-delà des frontières linguistiques.
L’évolution de la traduction automatique
Cette évolution est motivée par la volonté d’améliorer la compréhension des langues naturelles par l’intelligence artificielle, et ce processus est facilité par les algorithmes d’apprentissage automatique et les réseaux d’apprentissage profond.
Retraçons son histoire
La traduction automatique, comme son nom l’indique, correspond à la traduction d’un texte d’une langue à l’autre par le biais d’un ordinateur.
Les premières tentatives de traduction automatique s’appuyaient principalement sur des systèmes basés sur des règles, c’est-à-dire sur un ensemble de règles grammaticales élaborées à la main, et sur des dictionnaires bilingues.
Cependant, ces systèmes n’étaient pas assez performants lorsqu’il s’agissait de réaliser des traductions fluides et naturelles, car ils ne parvenaient pas à intégrer la complexité et la variabilité de la langue humaine.
À la fin du 20ᵉ siècle, les choses ont commencé à évoluer grâce à l’intégration de statistiques dans la traduction automatique.
Au lieu de procéder via des règles élaborées à la main, ces systèmes ont été créés à partir de corpus de textes bilingues.
Les modèles statistiques permettaient alors d’identifier les schémas linguistiques qui se répétaient dans les textes proposés à la machine, ce qui l’entrainait jusqu’à réaliser la traduction la plus proche du résultat que pourrait fournir un être humain.
Bien que cette approche ait pu représenter une avancée conséquente, les phrases à structures complexes et les expressions idiomatiques demeuraient des difficultés que la machine ne savait pas nécessairement transposer correctement dans la langue cible.
La traduction automatique neuronale : une approche novatrice
La recherche informatique et linguistique nous amène à l’innovation la plus récente et prometteuse : la traduction automatique neuronale (souvent appelée « NMT », pour « Neural Machine Translation » en anglais).
La NMT met à profit le deep learning (ou « apprentissage profond »), et tout particulièrement le réseau de neurones récurrents (« RNN » pour « Recurrent Neural Network ») et le mécanisme de l’attention.
Ces modèles sont capables d’apprendre une large gamme de règles linguistiques et de schémas, de traduire de longues phrases aux structures complexes, et même d’en comprendre les nuances et les subtilités.
La NMT permet de convertir les mots en vecteurs ou en plongements dans un espace de grandes dimensions, dans lequel les termes similaires seront associés.
Le modèle génère ensuite une séquence de ces vecteurs pour constituer une phrase.
Cette technologie utilise un cadre encodeur-décodeur, dans lequel l’encodeur cartographie la phrase d’entrée dans un espace vectoriel, et le décodeur génère ensuite la phrase traduite à partir de cet espace.
Le mécanisme de l’attention, fonction clé de la NMT, permet au modèle de se concentrer sur différentes parties de la phrase d’entrée à chaque étape de la génération de la phrase de sortie, ce qui lui permet ainsi de proposer une traduction plus correcte que les autres types de traductions machines.
Les techniques de NLP dans la traduction automatique
L’application du traitement automatique des langues (NLP) dans la traduction automatique a constitué une avancée cruciale dans le domaine de l’IA, puisqu’il permet aux ordinateurs de comprendre, d’analyser, et de générer la langue humaine en prenant en compte le contexte dans lequel une phrase se situe.
Cela implique plusieurs étapes secondaires telles que l’analyse des sentiments, le marquage des parties du discours, la reconnaissance des entités nommées, et bien d’autres.
Le NLP s’applique à de nombreuses étapes de la traduction automatique, et il améliore considérablement la compréhension de la langue source et la génération de la langue cible.
Intégrer le NLP à la traduction automatique a permis d’améliorer les compétences de celle-ci et a entrainé la création de modèles de traduction plus sophistiqués.
Cependant, il ne faut pas oublier que la traduction automatique basée sur le NLP est toujours en développement.
Des défis persistent, tels que le traitement des langues à faibles ressources, le maintien du style et du ton du texte source dans la version traduite, ou encore la compréhension des références culturelles et des expressions idiomatiques.
L’une des stratégies clés de l’intelligence artificielle pour faire face à ce défi est le perfectionnement continuel de ces modèles d’apprentissage automatique, ainsi que l’ajout de techniques de NLP plus avancées.
L’apprentissage par transfert est notamment une technique dans laquelle un modèle pré-entraîné est affiné pour une tâche en particulier.
Cette méthode est d’ailleurs pleine de promesses pour résoudre le problème du traitement des langues à faibles ressources.
De la même manière, des méthodes telles que l’algorithme BERT (« Bidirectional Encoder Representations from Transformers » en anglais) permettent d’obtenir une meilleure compréhension du contexte, mais également de maintenir le style et le ton du texte original.
Conclusion
L’impact du traitement automatique des langues (NLP) sur la traduction automatique (et sur un tas d’autres domaines) est sans pareil. Sa capacité à comprendre et à générer la langue humaine n’a pas seulement amélioré la traduction automatique, mais elle a comblé un fossé entre les humains et les machines.
Il y a d’ailleurs fort à parier que les futurs outils et applications de traduction automatique, ou même les agents conversationnels, soient de plus en plus puissants, et permettent des échanges humains-machines de plus en plus bluffants…
Mais rassurez-vous, chez BeTranslated, nous restons convaincus que ces outils ne remplaceront jamais totalement l’être humain.
Si vous êtes étudiant, sachez que depuis quelques années, il existe même plusieurs types de cursus universitaires axés spécifiquement sur le NLP, puisqu’il s’agit de la discipline au cœur des nouvelles technologies liées au langage naturel ; c’est notamment le cas de l’Université de Lorraine qui propose un parcours de master en traitement automatique des langues.
Entre recherche, informatique, ingénierie et linguistique, le NLP se trouve au carrefour de diverses sciences ; il s’agit donc d’une formation qui conviendra à des étudiants souhaitant acquérir une certaine polyvalence et un grand panel de connaissances.