Lorsque les bébés bénéficient de la sagesse de la foule

Résultats scientifiques Neuroscience, cognition

L'enregistrement des vocalisations des jeunes enfants à l’aide d’enregistreurs portables est une méthode prometteuse pour évaluer le développement du langage. Mais l'annotation précise et rapide d’un nombre élevé d’enregistrements aussi longs reste un défi. La contribution de citoyens volontaires sur des plateformes de collaboration en ligne pourrait être une solution. Dans cet article publié dans la revue Journal of Speech, Language, and Hearing Research, des chercheuses de l’ENS-PSL et de l’Université de Purdue ont évalué dans quelle mesure les annotations des scientifiques citoyens s'alignent avec celles recueillies en laboratoire.

Les retards de langage précoces pouvant avoir des conséquences négatives sur l'alphabétisation, le comportement, les interactions sociales et les résultats scolaires des enfants jusqu'à l'âge adulte, les interventions précoces ont été décrites comme un meilleur investissement sociétal que les interventions tardives. Mais comment pouvons-nous déterminer rapidement et précisément quels enfants sont à risque ?

Les progrès réalisés dans le domaine des technologies portables ont ouvert de nouvelles voies dans l’étude du développement du langage des nourrissons et des jeunes enfants. En effet, les enregistreurs portables permettent de recueillir des données dans l'environnement naturel de l'enfant sur une période longue, et à grande échelle, ce qui peut être particulièrement utile lorsqu’il s’agit notamment de récolter les vocalisations des enfants qui ne parlent pas beaucoup. L'un des inconvénients de la collecte d'enregistrements aussi longs est lié à la quantité élevée de données : dans une journée, chaque enfant peut être enregistré pendant plus de 10 heures. L'écoute des enregistrements prend non seulement beaucoup de temps, mais soulève également de nombreux problèmes éthiques et juridiques. Cet article révèle qu’avec des méthodes et des protections appropriées, les scientifiques citoyens peuvent contribuer à trier et annoter ces données et fournir des indices fiables du développement vocal de chaque enfant (les scientifiques citoyens sont des volontaires non professionnels qui participent à des tâches scientifiques simples afin de contribuer à divers projets de recherche).

Dans cette étude, plus de 11 000 tronçons audio contenant des vocalisations d'enfants ont été extraits des enregistrements de dix enfants diagnostiqués avec le syndrome d'Angelman - un syndrome neurogénétique rare caractérisé par de graves troubles du langage -  et de 10 nourrissons à faible risque. 

Pour pouvoir partager les enregistrements audio en toute sécurité sur le web avec des scientifiques citoyens, les enregistrements ont été découpés en morceaux d'une demi-seconde chacun, de telle sorte qu'aucune information sensible (par exemple les signes d’identification) ne puisse être diffusée. Les scientifiques citoyens ont été invités à participer aux travaux de recherche de l’équipe sur la plateforme Zooniverse (Zooniverse est un portail de science citoyenne, qui permet à chacun de prendre part à de véritables recherches de pointe dans de nombreux domaines allant de l'histoire à l'astronomie). 

En quelques mois seulement, plus de 1 000 personnes ont fourni plus de 150 000 annotations. Les annotateurs de Zooniverse ont classé chaque clip audio dans l'une des cinq catégories qui, ensemble, permettent d'évaluer la maturité des capacités vocales d'un enfant. Ces catégories comprenaient les syllabes "canoniques" (consonnes-voyelles, comme "bababa"), les syllabes "non canoniques" (voyelles seules/consonnes seules, comme "aaaaaah" ou "mmmm"), les "pleurs", les "rires" et le "bric-à-brac" (tout autre son ou bruit de fond qui aurait pu se glisser dans l'enregistrement). 

L’équipe de chercheuses a également annoté ces clips en laboratoire en utilisant des "méthodes de référence", dans le but d’évaluer dans quelle mesure les annotations des scientifiques citoyens s'alignent sur celles recueillies en laboratoire. Les chercheuses se sont concentrées sur quelques mesures spécifiques des vocalisations globales des enfants. Des corrélations très élevées ont été trouvées entre les proportions estimées à partir des données annotées par le laboratoire et les données annotées par les scientifiques citoyens sur Zooniverse. 

 Ces résultats sont particulièrement intéressants à une époque où l’utilisation des enregistreurs portables pour récolter des données est devenue courante. Le recours à la production participative peut ouvrir la voie à la création de grands ensembles de données de très bonne qualité qui rendent compte avec une grande précision de toute la diversité de la vie des enfants.

figure
© Alejandrina Cristia
Figure : vue globale du circuit de l'étude : depuis la prise de son avec l'enregistreur portable jusqu'à l'annotation des sons par les scientifiques citoyens sur la plateforme participative Zooniverse.


 

 

Pour en savoir plus :
Describing Vocalizations in Young Children: A Big Data Approach Through Citizen Science Annotation.
Semenzin C, Hamrick L, Seidl A, Kelleher BL, Cristia A.J
Speech Lang Hear Res. 2021 Jun 7:1-16. doi: 10.1044/2021_JSLHR-20-00661.

 

Contact

Alejandrina Cristia
Chercheuse CNRS au Laboratoire de sciences cognitives et psycholinguistique (ENS/PSL/CNRS)

Laboratoire

Laboratoire de sciences cognitives et psycholinguistique (ENS/PSL/CNRS)
29, 45, 46, rue d'Ulm
75005-Paris