Les industries du langage

Le 16 décembre 2014

Gabriel de BROGLIE

Interventions dans le cadre du Dialogue de haut niveau à l’Université de Pékin (BEIDA)
sur la langue : sa présence et son futur
le 16 décembre 2014

broglie_pekin_2014.jpg

Allocution de M. Gabriel de Broglie,
Chancelier de l’Institut de France

 

Les industries du langage

 

 

Tout d’abord bonjour. Je voudrais dire que je m’émerveille du plaisir que nous prenons à la célébration de nos langues. Nous nous livrons à cet exercice avec délectation et nous ne sommes pas prêts d’y renoncer et c’est tant mieux. Nous sommes conscients de détenir des trésors d’une richesse incalculable qui nous nourrissent, qui sont en même temps source de plaisir et dont on peut vivre. Nous voulons préserver ces trésors. Nous les connaissons, nous essayons de les connaître le mieux possible et nous voulons les faire connaître. Cela nous ramène peut-être à l’idée qu’il y a un paradis des langues, de la littérature. Ce paradis serait plutôt derrière nous et pas forcément devant nous. La question serait de le retrouver et de savoir s’il a atteint une perfection dans le passé qui serait un point indépassable par la qualité de nos langues ? J’exprime là des préoccupations qui peuvent être communes au français et au chinois.

Vous me posez la question qui nous préoccupe beaucoup qui est de savoir au XXIe siècle comment se présentent les choses. Très conscients de la tradition, nous avons le devoir de maintenir dans l’état d’exercice les trésors dont nous héritons et nous avons le devoir d’innover. Nous savons déjà très bien ce qu’il faut pour innover, mais il n’est pas sûr que nous réussissions très bien à exploiter toutes les ressources possibles. Nous avons la chance d’avoir une reconnaissance officielle de nos langues par l’État, par le monde officiel, par les règles générales et par un enseignement qui est aussi généralisé, ce qui n’est pas le cas de tous les pays au monde.

L’enseignement de la langue reste une priorité, un puissant appareil d’État. Nous portons nous Français des jugements assez péjoratifs et assez négatifs sur la qualité de l’enseignement du français par rapport à ce qu’il a été et ce qu’il devrait être encore maintenant. C’est un sujet très préoccupant. Je ne me prononce pas sur la qualité d’enseignement du chinois. Nous, nous sommes sévères et nous considérons qu’il y a là un enjeu très important pour l’avenir évidemment. L’avenir de la langue française dépend beaucoup de son enseignement. On peut constater que l’enseignement de la langue française est peut-être mieux assuré dans des pays de langue française qu’en France même.

Il y a d’autres enjeux qui sont aussi importants. Pour affronter les difficultés de l’avenir, il faut que la langue soit diffusée dans tous les médias nouveaux, ce qui est un sujet de vraie préoccupation. Il faut donc s’adapter à cette nouvelle situation. Le livre numérique va venir, viendra certainement, mais de toute façon l’univers numérique existe. Quel est le sort de la langue française, quel est le sort de la langue chinoise dans l’univers numérique, par l’internet et par les moyens de communication en particulier des sms et des nouveaux tics de vocabulaire, des nouvelles manies de vocabulaire qui se développent sur l’internet ? Est-ce dangereux pour nos langues ? Je suis de tempérament optimiste en général sur l’ensemble de ces questions et j’ai l’impression que la numérisation et l’internet sauvent les langues beaucoup plus qu’ils ne les menacent.

Ils sauvent les langues minoritaires et qui pouvaient être en voie de disparition et qui le sont moins à partir du moment où elles sont fixées sur internet. Ils sauvent aussi peut-être la reproduction de la langue chinoise grâce à la multiplication des caractères qui sont sur internet, ce qui n’a jamais été rendu possible avec les machines à écrire. Il y a donc là une étape qui est passée qui ouvre à la langue chinoise l’assurance que la richesse de son caractère idéographique n’est pas menacée par la technique, ce qui est très important. Nous devons donc veiller à ce que nos langues soient présentes sur l’internet, utilisent tous les moyens de communication et ne se laissent pas dépasser par les technologies. Je crois qu’il y a pour nous Français un grand effort à faire encore dans ce domaine.

Il y a une autre question qui est rarement évoquée. J’ai un peu de scrupules à l’évoquer devant vous mais c’est important. C’est la question des industries de la langue. Qu’est-ce que c’est que les industries de la langue ? C’est le prolongement de la numérisation et de l’internet. Les ordinateurs permettent de rendre des services considérables en matière de langue. On s’en servira de plus en plus. Le premier service évident, c’est celui de la traduction. La traduction automatique existe mais elle n’est pas de bonne qualité. Elle pourra devenir de bonne qualité, ce n’est pas très compliqué. Il faut simplement investir dans les industries de la langue. C’est un grand investissement industriel et financier. Les services que l’on peut attendre de cela sont assez importants. Il y a aussi la correction des erreurs de langage par la voie automatique. Vous savez qu’il y a des correcteurs automatiques d’orthographe pour l’écriture alphabétique et ça marche à peu près bien. Il y a aussi des correcteurs automatiques de syntaxe, c’est-à-dire qui rectifient la construction des phrases lorsqu’il y a une erreur de la part du rédacteur.

Il y a aussi des logiciels automatiques de résumé de textes. Vous mettez un texte de cinquante pages dans l’ordinateur, puis vous demandez un résumé en quinze lignes et l’ordinateur le fait. Plus étrange encore vous avez des logiciels de développement des textes, cela sert pour les affaires industrielles, commerciales. C’est-à-dire j’ai un objectif commercial en quinze lignes, mais cela n’est pas suffisant ; développez-le moi en trente pages pour être répandu auprès de tous les agents de la firme. Voilà des industries du langage. Quelle est la condition pour qu’elles fonctionnent ? C’est de rentrer dans l’ordinateur suffisamment de données pour que l’ordinateur ait la matière suffisante pour procéder à toutes les opérations qui lui sont demandées. Pour cela il faut que les matières mises dans l’ordinateur soient immenses, considérables. Un exemple : pour la langue française qu’est-ce que l’on met dans l’ordinateur ? On met dans l’ordinateur tous les dictionnaires, le Trésor de la langue française, ce magnifique instrument qui fait le recensement de tous les usages des mots de la langue française dans le passé avec les centaines de milliers de citations qui font référence pour différents usages des mots de la langue française. Cela ne suffit pas.

Il y a la langue d’aujourd’hui : comment entrer dans l’ordinateur la langue d’aujourd’hui ? Tout simplement en prenant la collection des journaux depuis par exemple 1945. Toute la collection des journaux, des quotidiens est entrée dans l’ordinateur pour qu’ils servent de référence pour que si l’ordinateur cherche des exemples il arrive à les trouver. Maintenant il y a le français parlé qui n’est pas tout à fait le même que celui du français écrit dans les journaux. Le français parlé on le trouve dans la radio. Pour avoir un bon investissement dans les industries de langage, il faut équilibrer le français écrit par le français parlé grâce à une quantité presque équivalente d’enregistrements à la radio qui sont passés dans l’ordinateur pour servir de référence. À quoi servent ces immenses références ?

Un exemple concret qui permet de comprendre facilement. Il y a des logiciels d’ordinateur pour jouer aux échecs et la grande question est de savoir s’il y aura enfin un ordinateur qui sera sûr de gagner toutes les parties d’échecs contre tous les plus grands champions d’échecs. Pour cela on a entrepris d’insérer dans l’ordinateur toute les parties d’échecs qui ont été jouées jusqu’à présent et on pense qu’avec cette immense quantité de documentation, d’information, l’ordinateur qui aura intégré toutes les parties d’échecs qui ont été jouées jusqu’à présent sera sûr de gagner la partie. On n’est pas encore arrivé à ce résultat-là ce qui est une très bonne nouvelle pour le cerveau humain, mais on y arrivera peut-être. Pour les industries du langage, c’est la même chose. Lorsque l’ordinateur aura toutes les données du langage, il pourra faire toutes les opérations et il gagnera la partie.