Comment reconstruire les paysages linguistiques du passé : de la linguistique historique à la géographie historique des langues
#ZOOM SUR...
Matthias Urban est chargé de recherche CNRS au sein du laboratoire Dynamique du Langage (DDL, UMR5596, CNRS / Université Lumière Lyon 2). Il dirige un projet de recherche sur la dynamique de la géographie des langues, financé par une Consolidator Grant du Conseil européen de la recherche. Il travaille sur les manifestations et l'étendue, la genèse et l'histoire, les fondements culturels et non linguistiques de la diversité linguistique en général, et s'est spécialisé dans l'histoire des langues indigènes d'Amérique du Sud, en particulier dans les Andes.
Les langues conservent un signal historique qui nous relie à des ancêtres disparus qui vivaient il y a de nombreuses générations dans des lieux qui peuvent sembler incroyablement éloignés.
Par exemple, les pronoms français je et moi remontent aux formes ego et mē d'un type familier de la langue latine, à partir de laquelle ils ont été transmis de génération en génération avec de petits changements progressifs dans la prononciation. Les pronoms latins, eux aussi, ont été hérités et transmis d'une langue encore plus ancienne qui était parlée quelque part en Italie du Nord il y a peut-être 3 000 ans (nous appelons cette langue « proto-italique » parce que nous ne savons pas comment ses locuteurs eux-mêmes s'y référaient). Là encore, le proto-italique a hérité des formes d'une langue ancestrale encore plus ancienne, parlée il y a environ 8 000 ans, donc au cœur de l'âge du bronze, probablement quelque part dans les steppes d'Europe orientale au nord du Caucase, ou peut-être en Anatolie. Dans cette langue, appelée « proto-indo-européen » par les spécialistes, les formes correspondant à je et moi étaient *h1eg et *h1éme (l'astérisque devant les formes indique qu'elles ne sont pas attestées mais ont été reconstituées par des linguistes historiques, et le h1 représente un son consonantique particulier qui était présent dans cette langue ancestrale et qui s'est perdu par la suite)1.
Cette langue était très différente des langues qui en descendent, comme finalement le français. Selon certains, elle comportait des consonnes exotiques que l'on retrouve encore aujourd'hui dans les langues du Caucase et qui sont produites accompagnées d'un effet « plop » marquant (pour les curieux, un son « k » avec cet effet peut être entendu ici.
Comme pour les deux pronoms, on peut reconstruire tout un vocabulaire pour cette langue ancestrale et comprendre beaucoup de choses sur le fonctionnement de sa grammaire. Certains mots de cette langue présentent des similitudes si frappantes avec ceux des langues voisines que l'on peut supposer qu'ils ont été empruntés d'une langue à l'autre dans les profondeurs de la préhistoire. Le mot pour « vin », par exemple, reconstruit comme *woínom, en fait partie. On trouve également un mot similaire dans les anciennes langues sémitiques apparentées à l'hébreu et à l'arabe, ainsi que dans certaines langues caucasiennes. Grâce au vocabulaire, nous pouvons également reconstituer certaines des institutions culturelles des personnes qui parlaient cette langue et les choses auxquelles elles attachaient de l'importance. Par exemple, une expression fixe attestée dans plusieurs langues indo-européennes anciennes se traduit par « gloire impérissable ». Cette expression, et le concept qu'elle exprime, ont dû être hérités tels quels du proto-indo-européen lui-même. Et l'on peut entrevoir les mythes que les peuples racontaient à travers des formules archaïques conservées dans plusieurs langues filles.
Le français et les autres langues romanes ne sont pas le seul pedigree de cette langue proto-indo-européenne. L'allemand, le breton, le grec, l'arménien, le persan, l'hindi et de très nombreuses autres langues, certaines encore parlées, d'autres déjà éteintes, le sont également. En résumé, ce qui n'était qu'une petite communauté linguistique de l'âge du bronze parmi d'autres dans la steppe de l'Europe de l'Est s'est transformée en une famille de langues comptant des milliards de locuteurs, répartis dans toute l'Eurasie et au-delà.
Cela montre que nous pouvons également retracer la façon dont les familles linguistiques se sont répandues par la migration, la conquête ou l'adoption de la langue et de ses formes descendantes par des personnes qui abandonnent leur propre langue en faveur de celle-ci. Ainsi, la diversification de l'indo-européen qui a conduit de *h1eg et *h1éme à je et moi, par exemple, a une dimension géographique évidente dans la mesure où la langue a parcouru des milliers de kilomètres depuis la steppe jusqu'à la botte italienne et est remontée avec les Romains en Gaule.
Tout cela montre la capacité de la linguistique historique à remonter loin dans le passé et à révéler des choses sur nos ancêtres et leur culture qui ne sont pas accessibles aux autres disciplines qui étudient la préhistoire de l'humanité.
Mais il y a aussi des limites.
Bien que nous disposions d'une méthode généralement valable pour reconnaître les relations entre les langues, reconstruire les ancêtres des langues apparentées et prévoir leur évolution, la géographie de la dynamique des langues à travers le temps ne peut être théorisée qu'au cas par cas. Nous pouvons le faire pour l'indo-européen, puis pour la famille de langues suivante, puis pour la suivante, en nous basant à chaque fois sur les spécificités de chaque famille, mais il n'existe aucune théorie sur la façon dont les langues et les familles de langues se répandent dans l'espace géographique au-delà des cas individuels.
En outre, pour retracer la diversification linguistique dans l'espace et dans le temps de la manière que nous venons d'esquisser, nous devons d'abord avoir la chance que les langues soient apparentées au point de former des familles. Ce n'est pas forcément le cas. De nombreuses régions du monde ne possèdent pas le type de familles linguistiques très anciennes et diversifiées que l'on trouve en Eurasie. Dans ces régions, ce sont des familles de langues plus petites, où les langues individuelles sont assez étroitement liées, qui prédominent. Ces familles ne permettent pas de remonter très loin dans le temps, de sorte que notre « horizon temporel » linguistique pour ces régions est assez limité. D'autres langues, quels que soient les efforts déployés, ne peuvent être reliées à aucune autre langue connue par le type de transmission de génération en génération qui conduit à des familles de langues comme l'indo-européen. En Europe, le basque est le seul exemple de ce que l'on appelle une « langue isolée ». Mais dans d'autres parties du monde, ils sont assez courants.
Ces petites familles et ces isolats ont longtemps laissé les linguistes historiques perplexes, avant de hausser les épaules et de se tourner vers autre chose. Il n'y avait tout simplement rien à faire ici — les méthodes de la linguistique historique ne s'appliquaient pas. Dès le début du xxe siècle, Antoine Meillet, l'un des plus grands linguistes historiques de tous les temps, a déclaré que les langues isolées étaient des « langues sans histoire »2.
Actuellement, au sein du laboratoire Dynamique du Langage à Lyon, nous explorons une nouvelle approche de l'histoire des langues, grâce à un généreux financement de l'Union européenne. Cette approche est plus inclusive et vise à nous permettre de dire quelque chose sur les langues qui ont été trop longtemps laissées à l'écart de la théorisation, tout en accordant une attention plus systématique à l'aspect géographique de la diversification des langues, plutôt qu'au vocabulaire et à la grammaire proprement dits.

Urban M. 2021,The geography and development of language isolates, Royal Society Open Science 8 (4) : 202232
Pour illustrer notre propos, revenons un instant au basque, seule langue isolée d'Europe. On peut affirmer que cette langue, ou un parent très proche connu des Romains sous le nom d'« aquitain », était autrefois parlée dans une zone beaucoup plus vaste, jusque dans les Pyrénées et la plaine de l'Èbre, dans le nord de l'Espagne. L'évolution historique montre qu'il a continuellement perdu du terrain et reculé de plus en plus vers la côte atlantique du golfe de Gascogne à mesure que les gens passaient au latin et à ses descendants (Figure 1). L'histoire montre qu'il y a une raison à cela : pour les Romains, le terrain accidenté de l'actuel Pays basque, avec une productivité agricole limitée et des ports donnant sur l'Atlantique — qui n'étaient pas une priorité pour les empires méditerranéens — ne présentait que peu d'intérêt, ce qui limitait le rôle du latin et garantissait la survie du basque. En résumé, la géographie joue un rôle dans la survie de la langue, et il existe des cas parallèles dans le monde entier3.

Photo adaptée de https://en.wikipedia.org/wiki/Tartessian_language#/media/File:Estela_de_ Mesas_de_Castelinho.jpg. CC BY 2.0
Par exemple, dans l'Antiquité, la carte linguistique de l'Europe était encore bien différente. En effet, il existait plusieurs langues, comme le basque, qui avaient survécu non seulement à la diffusion du latin, mais aussi à l'arrivée antérieure de l'indo-européen. Ces langues dites « paléo-européennes » se trouvaient à différents endroits. Dans le sud-ouest de la péninsule ibérique, par exemple, il existait une langue appelée tartessien. Elle est connue par des inscriptions qui peuvent être lues phonétiquement mais pas comprises, comme celle de la stèle trouvée sur le site de Mesas de Castelinho (Figure 2). Quelle que soit cette langue, elle n'est pas indo-européenne. Les îles de la Méditerranée avaient également leurs propres langues — pour les langues « étéocrétois » et « étéocypriote » de Crète et de Chypre, il existe de courtes inscriptions comparables à celles trouvées dans le tartessien, pour la Sardaigne, cela se manifeste principalement par des noms de lieux et des repères géographiques qui ne peuvent être interprétés par le latin ou une autre source indo-européenne. La distribution générale est telle que ces langues « paléo-européennes » ont tendance à se trouver à la périphérie géographique, près du littoral comme le basque, ou sur des îles qui nécessiteraient un effort supplémentaire pour les atteindre. Comme le basque, ces langues sont probablement des « survivantes » dont la lignée était déjà présente en Europe avant que les langues indo-européennes et leurs ancêtres n'arrivent de l'est au cours de la préhistoire, et qui ont survécu à l'indo-européanisation de l'Europe au cours de la préhistoire, notamment en raison de leur situation géographique périphérique.
Sur la base d'un tel raisonnement, ce projet renverse l'orientation traditionnelle de la linguistique historique : au lieu d'étudier la manière dont les familles de langues s'étendent, nous nous intéressons à la manière dont les langues perdent les territoires où elles étaient autrefois parlées lorsqu'elles sont soumises à des pressions dans le sillage d'expansions linguistiques (comme celle du latin dans la péninsule ibérique) et aux endroits où elles tendent à survivre. En comparant les très nombreux cas connus en Eurasie et dans le reste du monde, notamment en ce qui concerne les isolats linguistiques, nous espérons pouvoir établir des idées plus générales sur les endroits où les langues se répandent préférentiellement, et ceux où elles ont tendance à ne pas se répandre ou seulement tardivement, permettant ainsi à des langues chronologiquement plus anciennes de continuer à exister. Par exemple, il pourrait s'avérer que la proximité de barrières géophysiques majeures, comme un littoral accidenté ou une zone montagneuse importante, tend à favoriser la « survie » des langues — ou il pourrait s'agir d'autre chose : la question est totalement ouverte et nous pourrions avoir des surprises.
Cela nous donnera une idée claire et objective des régions du monde qui sont susceptibles de favoriser la préservation de couches de diversité linguistique chronologiquement plus anciennes. Nous pourrons alors voir quel type de répartition nous trouvons dans ces régions du monde et si elle diffère de celle des régions environnantes. Par exemple, nous pourrions nous attendre à ce qu'elles présentent des niveaux plus élevés de diversité généalogique qui se sont accumulés parce que les langues préexistantes n'ont pas été complètement remplacées par les vagues d'expansion linguistique qui ont déferlé. Un autre paramètre crucial à prendre en compte concerne la structure des langues. Comme le savent tous ceux qui ont essayé d'apprendre le basque comme deuxième langue, son fonctionnement est radicalement différent de celui du français et des autres langues indo-européennes d'Europe, et il est intéressant de noter qu'il trouve des parallèles plus proches dans le Caucase — qui pourrait être une autre enclave linguistique où les langues ont eu le temps de se diversifier sur place sans remplacement majeur pendant des millénaires. Des ruptures aussi nettes dans le fonctionnement des langues peuvent également être révélatrices de différentes dynamiques régionales qui reflètent la coexistence de différentes couches chronologiques dans la géographie des langues. Dans le cadre de ce projet, nous serons en mesure de vérifier si c'est le cas d'une manière non circulaire. Si c'est le cas, la lignée linguistique du basque et sa structure représentent probablement quelque chose qui était plus répandu en Eurasie avant que la propagation des langues ne change la scène linguistique de façon décisive et ne conduise à la prédominance de langues d'autres types.
Cette approche de la linguistique historique est différente de l'approche classique. Nous ne saurons pas à qui les gens de l'âge du bronze parlaient du vin et s'ils recherchaient une « gloire impérissable ». Mais elle nous offrira une fenêtre plus large sur la préhistoire linguistique qui complète et améliore ce qui peut être fait en linguistique historique pour les régions où les méthodes traditionnelles ne s'appliquent pas ou ont un horizon temporel limité.
Aller plus loin
- Urban M.. 2021, The geography and development of language isolates, Royal Society Open Science 8 (4) : 202232. https://doi.org/10.1098/rsos.202232
- Cet article est issu du dossier Le langage en commun à retrouver dans la Lettre n°91
Contact
Notes
- Sur ces reconstructions proto-indo-européennes, voir : Mallory J.P, Adams D. Q. 2016, The Oxford Introduction to Proto-Indo-European and the Proto-Indo-European World, Oxford University Press.
- Meillet A. 1925, La méthode comparative en linguistique historique, Ed. Champion. Ces propos sont néanmoins à nuancer : voir par exemple Campbell L. 2021, Historical Linguistics. An introduction, MIT Press, pour l’utilisation des emprunts comme élément de datation relative et attestation des changements linguistiques au sein des isolats linguistiques.
- Trask R.L. 1997, The history of Basque, Routlegde.