« Écoutez-moi rugir ! » L'évolution et les fonctions sociales des vocalisations humaines non verbales
#ZOOM SUR...
Katarzyna Pisanski est chargée de recherche CNRS au Laboratoire Dynamique du Langage (DDL, UMR5596, CNRS / Université Lumière Lyon 2). Ses recherches visent à comprendre les origines, le développement, les mécanismes et les fonctions de la communication acoustique chez les mammifères, y compris notre propre espèce. David Reby est professeur au sein de l’Équipe Neuro-Ethologie Sensorielle (ENES) du Centre de Recherche en Neurosciences de Lyon (CRNL, UMR5292, CNRS / Inserm / Université Claude Bernard Lyon 1). Il étudie l'origine, la structure et la fonction des signaux vocaux chez les vertébrés, et mène des études observationnelles et expérimentales sur un large éventail d'espèces.
Les vocalisations non verbales, telles que les cris, les pleurs, les rires et les gémissements, occupent une place unique dans le répertoire vocal humain. Elles sont par définition non linguistiques, et sans la contrainte de communiquer des informations linguistiques intelligibles, elles sont libres d’exploiter la diversité acoustique du répertoire vocal humain. Les cris, par exemple, peuvent atteindre des fréquences extraordinairement élevées et occuper une niche distinctive de rugosité acoustique qui n'est pas observée dans la parole ordinaire. Cela signifie que les vocalisations non verbales, contrairement à la parole, peuvent prendre de nombreuses formes acoustiques différentes afin de communiquer des motivations, des émotions et même des informations nuancées.
Bien que très peu d'études interculturelles aient été menées sur les vocalisations non verbales humaines, ces dernières ont été observées dans toutes les sociétés étudiées à ce jour. Pourtant, nous ne savons toujours pas quand, comment et pourquoi elles sont apparues au cours de notre évolution, comment elles apparaissent et se développent au cours de la vie, comment elles diffèrent selon les individus ou les groupes, et ce qu'elles communiquent au sein de différentes cultures et systèmes linguistiques.
Katarzyna Pisanski et David Reby ont uni leurs forces pour étudier le « langage » secret de ces vocalisations. Leur projet de recherche, lancé en 2022, est financé par la Mission des initiatives transversales et interdisciplinaires (MITI) du CNRS à travers une bourse 80-Prime qui vise à soutenir et renforcer les liens interdisciplinaires entre les instituts du CNRS (Projet EvoHumanVoice), ainsi que par l’Agence Nationale de la Recherche (Projet SCREAM).
Le projet vise à répondre à des questions de recherche qui s’inscrivent dans le cadre des quatre questions de Nicolas Tinbergen, l’un des fondateurs de l'éthologie moderne : quels sont les mécanismes biologiques et cognitifs qui régissent la production et la perception des vocalisations non verbales ? Comment se développent-ils au cours de la vie d'un individu ? Quelles sont leurs fonctions adaptatives ? Quelles sont les racines phylogénétiques ancestrales des vocalisations non verbales ?
L'étude de la forme et de la fonction des vocalisations humaines dans une perspective comparative va nous permettre d’apporter des réponses à ces questions. En effet, des observations récentes suggèrent que les formes acoustiques des vocalisations humaines, comme celles d’autres animaux, correspondent à leurs fonctions de communication. Prenons par exemple le rugissement d'un lion. La fréquence basse, l’amplitude extrême et la rugosité de ce cri sont adaptés à sa fonction de communiquer la menace et le danger. Or, des recherches récentes de l'équipe de l'ENES montrent que les vocalisations agressives humaines partagent une structure acoustique très similaire, comme le montre l'image spectrogramme d'un « rugissement » agressif humain, caractérisé par une faible hauteur de son et un degré élevé de rugosité acoustique. En revanche, les cris de détresse ou de peur produits par diverses espèces de mammifères, dont l'homme, sont généralement beaucoup plus aigus que les vocalisations agressives. La structure acoustique des cris de détresse correspond à leur fonction d'attirer et de retenir l'attention de l'auditeur. Dans le cas des cris de bébés humains, l'auditeur est le plus souvent le parent qui est motivé pour faire cesser les pleurs de son enfant, lui prodiguant ainsi soins et attention. Les formes acoustiques des vocalisations animales et humaines semblent donc bien ne pas être arbitraires, mais plutôt avoir évolué pour exploiter la sensibilité des auditeurs, chaque type de cris ayant sa propre fonction de communication.
Bien que des travaux récents montrent que les vocalisations non verbales humaines partagent effectivement des similitudes essentielles avec celles des autres animaux, il existe une différence importante : nous, les humains, avons une capacité remarquable à modifier facilement et volontairement la structure acoustique de nos vocalisations. Nous pouvons même les produire en l'absence totale de stimuli externes ou internes qui déclencheraient normalement leur production chez d'autres animaux. Cette capacité de modulation volontaire de la voix est très certainement apparue avant la parole chez nos ancêtres, probablement grâce à l’évolution de connexions néocorticales directes entre le cortex moteur et les motoneurones du tronc cérébral qui contrôlent les muscles laryngés (y compris les cordes vocales) et les articulateurs vocaux tels que les lèvres, la langue et la mâchoire. Ces connexions neuronales directes sont largement absentes chez nos plus proches parents primates, dont les capacités de contrôle vocal sont très rudimentaires par rapport à celles des humains. La pression de sélection pour cette dynamique vocale sans précédent chez l'homme pourrait avoir joué un rôle crucial dans l'évolution de la parole. De ce point de vue, les vocalisations non verbales humaines représentent des « fossiles vivants » du chaînon manquant entre les cris des animaux et la parole humaine. Leur étude nous permettra d’apporter un nouvel éclairage sur la façon dont l'homme a acquis la capacité de la parole, qui reste absente chez les autres mammifères (y compris les grands singes).
Un objectif essentiel du projet 80-Prime est de vérifier l'universalité des formes et des fonctions des vocalisations non verbales humaines à travers les cultures. La grande majorité des recherches sur le comportement humain, y compris le comportement vocal, a été menée sur des personnes « WEIRD », c'est-à-dire issues de sociétés occidentales aux populations majoritairement blanches (White), éduquées (Educated), industrialisées (Industrialised), riches (Rich) et démocratiques (Democratic). Le plus souvent, il s'agit d'étudiants universitaires d'Amérique du Nord, d'Europe ou de certaines régions d'Asie. Le fait de se concentrer sur les personnes WEIRD limite considérablement la généralisation des résultats à l'ensemble de l'espèce Homo sapiens et limite la capacité des chercheurs à déterminer l’influence sur le comportement humain de facteurs tels que l'âge, la géographie, la culture, le statut socio-économique, l'exposition aux médias ou la langue.
En enregistrant des vocalisations non verbales dans plusieurs dizaines de populations humaines à travers le monde, y compris au sein de petites sociétés isolées, et en testant la perception de ces vocalisations par les auditeurs au sein d'une même culture et entre cultures différentes, le projet vise à déterminer dans quelle mesure le comportement vocal non verbal humain partage certains universaux, tout en identifiant les facteurs qui pourraient expliquer les différences constatées entre les cultures. Si la forme acoustique des vocalisations non verbales humaines, comme celles d'autres animaux, reflète effectivement leurs fonctions évoluées, nos études interculturelles devraient nous permettre de mettre en évidence certains universaux dans leur production et leur perception. Cela peut être particulièrement vrai pour les vocalisations spontanées ou « authentiques » qui impliquent un faible degré de contrôle vocal. À l’inverse, la capacité unique qu’ont les humains à contrôler et moduler volontairement leur production vocale est susceptible d'introduire un degré de variabilité culturelle, en particulier dans les vocalisations non verbales contrôlées volontairement.
L'étude des vocalisations non verbales humaines couvre un éventail de disciplines de plus en plus large qui va de la psychologie, l'anthropologie et la linguistique à la biologie, l'éthologie et l'informatique. La resynthèse acoustique est un outil particulièrement puissant dont le projet tirera pleinement parti. Elle offre aux chercheurs et chercheuses la possibilité de manipuler systématiquement des paramètres acoustiques spécifiques dans les signaux vocaux, tels que la hauteur ou la rugosité, afin de tester de manière causale comment ces paramètres acoustiques affectent les réponses cognitives ou comportementales des auditeurs lors d'expériences de psychoacoustique. Grâce à cette nouvelle technologie, il est ainsi possible de tester de manière systématique des hypothèses spécifiques sur les fonctions communicatives des composants acoustiques qui forment les vocalisations non verbales humaines.
Ainsi, longtemps ignorées par les chercheurs, peut-être parce qu'elles soulignent notre animalité et peuvent parfois même être perçues comme dérangeantes, le positionnement ontogénétique et phylogénétique unique des vocalisations non verbales humaines en fait un excellent sujet de recherche pour répondre à des questions cruciales quant à l'évolution de la communication vocale chez l'homme.
Contact