La traduction automatisée (3e partie)

La traduction automatique (TA)
La traduction automatique, ou traduction machine, s’effectue sans intervention humaine. Il existe deux grands concepts[1] : la traduction automatique basée sur des règles et la traduction automatique statistique. Quoique certains systèmes utilisent également une combinaison de ces modèles (systèmes mixtes).

La traduction automatique basée sur des règles
Elle utilise des dictionnaires et des règles de grammaire et de conjugaison. C’est la méthode classique située au cœur des logiciels grand public, comme Reverso et Babelfish. Très répandus et souvent gratuits, ces logiciels atteignent vite leurs limites dès que le texte est complexe ou qu’ils font face à des expressions ambiguës.

Par exemple, ils traduiront correctement « Être dans de beaux draps » (to be in a mess), mais ils auront un peu de problèmes avec « Il a dormi dans de beaux draps » (He slept in a mess).

La traduction automatique statistique
C’est le modèle qui semble le plus prometteur, je vais donc m’y attarder.

Très grossièrement résumé, ce modèle fonctionne en deux temps. On alimente tout d’abord la base de données du système avec des textes bilingues, un peu comme les mémoires de traduction (voir La traduction automatisée, 2e partie). À partir de ce contenu, le système déterminera ensuite par calcul statistique (probabilités) la meilleure traduction à utiliser.

C’est notamment le principe utilisé par Google Traduction

Sur le plan purement linguistique, la qualité de la traduction automatisée repose essentiellement sur quatre critères :

    • Le volume de documents de référence bilingues (corpus) fournis au système.
  • L’adéquation entre ce corpus et le domaine précis des textes à traduire. En effet, qui dit traduction spécialisée, dit langue et vocabulaires particuliers.
    Même chose quand on a affaire à des grandes entreprises, qui ont bien souvent une façon de parler, une terminologie et un style qui leur sont uniques.
  • La qualité de ce corpus. Comme nous les humains, pour apprendre, la machine a besoin de bons documents de formation. Son apprentissage dépend de la qualité linguistique des paires texte de départ-texte d’arrivée qu’on lui a donné à « digérer ».
  • La qualité du texte à traduire (qualité de la rédaction). L’ambiguïté est l’ennemi numéro 1 de la traduction machine. Elle ne peut efficacement prédire une traduction que si le texte d’origine est correctement construit, si les mots utilisés sont les bons et si les règles de grammaire sont bien respectées.

Nous verrons dans la quatrième et dernière partie ce que cela signifie dans la pratique…

(à suivre)


[1] Un troisième principe, la traduction automatique à base d’exemples, a fait son apparition récemment, mais je ne l’aborderai pas.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s