15 octobre 2006

Croissance quadratique des traductions européennes

Emission très intéressante sur Europe 1 hier, annoncée par Jean Véronis la semaine dernière. En bonus de la discussion sur la cyberlangue qui sera certainement approfondie dans un livre comme évoqué en fin d'émission, le co-animateur Nicolas Delourme évoque à la mi-temps l'explosion des demandes en traduction des institutions de l'Union Européenne (traductions effectuées par la Direction Générale de l'Interprétation) avec l'élargissement, déjà évoqué par exemple dans un article de La Libre de 2003.

Et là les mathématiques sont un poil malmenées. Nicolas Delourme commence par citer les langues actuellement gérées : anglais, allemand, français, italien, espagnol, néerlandais, grec, portugais, sudéois, danois, finnois et depuis l'élargissement de 2004, estonien, hongrois, letton, lituanien, maltais, polonais, slovaque, slovène et tchèque.

Pour calculer le nombre de sens de traductions, c'est simple, on a 20 langues-sources à traduire, et pour chacune 19 possibilités de langue-destination, soit 380 possibilités. Ce qui nous donne, pour n langues, n(n-1) possibilités de sens. Au passage, dommage que les interprètes/traducteurs ne soient apparemment pas parfaitement billingues, ce qui diviserait ce nombre par deux (il faut d'après ce calcul un interprète du français vers l'anglais, et un autre de l'anglais au français). De toute façon la croissance du nombre de sens de traductions en fonction du nombre de langues est quadratique (proportionnel au carré du nombre de langues) et pas exponentiel comme le dit Nicolas Delourme :

"Et comme le nombre de possibilités, pour utiliser un terme qui va plaire à Jean Véronis, comme le nombre de possibilités est exponentiel, à chaque fois que l'on rajoute une langue, la DGT doit aujourd'hui faire face à 380 combinaisons possibles, aussi bien en traduction de texte qu'en interprétation de discours."

Alors évidemment, le terme "exponentiel" est certainement plus parlant que "quadratique" pour évoquer une hausse importante. Mais il faut bien avoir à l'esprit qu'une complexification quadratique (ou même polynomiale) d'un problème par rapport au temps est tout à fait maîtrisable, grâce par exemple à la loi de Moore, qui nous promet que nos moyens de calculs bénéficient d'une croissance exponentielle : les performances sont doublées à peu près tous les 2 ans, les prix divisés par deux dans la même période. Et même plus généralement que cette "loi" qui s'applique typiquement sur le champ restreint du matériel informatique, on attend généralement du chiffre d'affaire d'une entreprise, ou du PNB d'un état, une croissance constante en pourcentage, soit une valeur en hausse exponentielle par rapport au temps.

Ainsi, tant que chaque langue ne donne pas naissance à 2 langues-filles à chaque décennie (ce serait rigolo, que la communauté européenne multiplie le nombre de ses langues par deux en considérant la version SMS de chacune...), le budget nécessaire à la traduction gardera une progression quadratique tout à fait gérable.

Evidemment, l'existence de la loi de Moore ne constitue pas un prétexte pour se dire qu'il est inutile de chercher à faire des économies en étant plus efficace, et le système de langues pivots qui consiste à avoir une traduction en deux temps (3 interprètes pour la langue actuellement parlée, un vers l'anglais, un vers l'allemand et le troisième vers le français, ainsi qu'un interprète d'une de ces trois langues vers chacune des 19 langues) est intéressant dans l'optique d'une économie de moyen (même s'il est nécessaire en pratique pour éviter de rechercher des interprètes du lettonien au portugais...). Mais le résultat du calcul mentionné par Nicolas Delourme est erroné, il compare les 380 possibilités des traductions exhaustives, à 60 dans le cas des langues-pivots (détail sur le travail des "interprètes relayeurs" page 9 de ce document) :

"Ce procédé permet déjà de limiter le nombre d'interprètes à 60 pour un régime complet de traduction. [...] 60 interprètes seulement pour 380 combinaisons possibles."

En fait, il faut pour chacune des 20 langues une traduction vers l'anglais, l'allemand et le français, ce qui donne 60, moins les traductions anglais-anglais, allemand-allemand, et français-français, ce qui fait 57. Et une fois que les traductions dans les trois langues pivot ont été obtenues, il faut les traduire vers seulement 17 langues, ce qui donne 57+17*3=108. De façon plus intelligente, on peut même traduire seulement l'une des 3 langues pivot vers une des 17 autres langues, soit un résultat total de 57+17=74 sens de traduction différents.

Cet exemple est typique d'erreurs que l'on peut faire lors de calculs de probabilités ou de combinatoire qui semblent très simples apparemment, mais qui s'avèrent cacher des cas particuliers ou des répétitions à considérer... Quoi qu'il en soit, ces calculs sont seulement théoriques puisqu'on n'emploie pas exactement un traducteur par sens de traduction comme expliqué dans l'article de La Libre...

2 commentaires:

Jean Véronis a dit…

Oui, mais avoue: n * (n - 1), ça ne le fait pas sur à heure de grande écoute sur Europe 1 !

FreeCorp a dit…

En effet, je pensais plutôt simplement à "quadratique" mais c'est vrai que le terme est moins commun. Je viens de vérifier dans mon Larousse Compact, il n'y est pas, en revanche pour "exponentiel" je trouve : "2. Qui se fait de façon rapide et continue : Montée exponentielle du chômage". Ah, les méfaits de la vulgarisation scientifique... Bientôt on entendra les journalistes nous dire que le problème du chômage est NP-complet.