La science ouverte et les frontières des données anthropologiques
#ANTHROPOLOGIE EN PARTAGE
À ses débuts à la fin du xixe siècle, l’anthropologie s’employait surtout à repousser les frontières géographiques de la connaissance des sociétés humaines. À l’affût des sociétés inconnues en Occident, avide d’établir les premiers contacts avec des populations et de documenter leurs langues et leurs coutumes, elle était dans une expansion qualifiée par la suite de « coloniale », par association avec la réalité historique dans laquelle elle s’est souvent déroulée.
Si la controverse autour de cette « conquête » scientifique des populations indigènes a, en grande partie, délégitimé les écrits scientifiques de l’époque, l’anthropologie, de ces premiers temps, a aussi recueilli des données dont la valeur patrimoniale est aujourd’hui inestimable de par la rareté des témoignages de cette époque. Avec la fin des expéditions scientifiques (souvent multidisciplinaires) dont le caractère collectif et mandaté garantissait aussi le dépôt systématique des données dans les musées d’ethnographie, de sciences naturelles ou d’ethnologie, qui fleurissent entre la fin du xixe et le début du xxe siècle, l’anthropologie devient un métier solitaire. L’anthropologue part souvent seul sur le terrain, habite sur le long terme dans une communauté dont il ou (de plus en plus) elle partage le quotidien, revient avec un ensemble de données empreintes des liens qu’il ou elle a établis sur place. Difficile alors de tracer une frontière entre les auteurs de ces données. À qui appartient le savoir d’une communauté aujourd’hui : la collectivité qui l’a engendré ou son narrateur circonstanciel ? Qui est l’auteur d’un récit mythologique : celui qui raconte une histoire transmise oralement depuis plusieurs générations ou celui qui tient la plume pour la transcrire ? En même temps, de manière assumée et d’autant plus forte que dans d’autres champs scientifiques, la donnée anthropologique n’est pas froidement collectée comme une observation objectivable, mais bien co-créée par un observateur dont le regard sur le monde est unique. Cet observateur n’a-t-il pas le droit à la reconnaissance de l’œuvre de son esprit ? La frontière entre le caractère scientifique et subjectif des données anthropologiques est mince et c’est, après tout, ce qui permet au lecteur d’entrer en résonance avec elles et de se les approprier.
C’est dans ce contexte de solitude épistémique que, dans les années 1980, ont commencé à être constituées et déposées, à la Bibliothèque Éric de Dampierre du Laboratoire d’ethnologie et de sociologie comparative (LESC, UMR7186, CNRS / Université Paris Nanterre) des archives d’ethnologues, sous l’impulsion de Marie-Dominique Mouton, alors bibliothécaire et ingénieure de recherche au CNRS, et d’Éric de Dampierre, fondateur du laboratoire. Au moment du départ à la retraite, parfois après son décès, l’anthropologue ou ses ayants-droits s’aperçoivent que des témoignages historiques uniques risquent de disparaître. Car tout ne fait pas l’objet de publication en anthropologie et a été rassemblé pour pouvoir être retrouvé, relu, référencé, réutilisé. Les photos, les vidéos, les enregistrements sonores, les croquis et les cartes, les documents recueillis sur place ainsi que des pans entiers de notes contenant des observations et informations qui sont des à-côtés par rapport aux intérêts thématiques du chercheur, ne trouvent jamais leur chemin vers la publication. En vrac, non indexés, souvent sur des supports périssables, multi-langues, ces matériaux constituent autant d’informations sur les communautés et sujets de recherche, que sur la personnalité et la vie du chercheur. Si la deuxième caractéristique est traditionnellement exploitée pour les grandes figures de l’anthropologie (Lévi-Strauss, Malinowski, Leiris), c’est sur la première que nous aimerions insister ici, car l’intérêt pour les communautés étudiées par les chercheurs et chercheuses concerne les matériaux recueillis sur le terrain d’enquête par l’ensemble des anthropologues, d’hier comme d’aujourd’hui.
Lorsque l’injonction à ouvrir les données scientifiques s’est concrétisée via la politique européenne de la science ouverte, qui demande de mettre à disposition de manière la plus large possible les données de recherche non protégées ou confidentielles (voir également, à ce sujet, la Feuille de route du CNRS pour la science ouverte parue fin 2019), les anthropologues étaient déjà depuis longtemps engagés et motivés par ce qu’ils appelaient la restitution de leurs travaux aux communautés parmi lesquelles ils avaient mené leurs recherches, aussi appelée « retour au pays » » par les ethnomusicologues. La question était plutôt pragmatique : comment, quand et à qui exactement restituer ? C’est pourquoi, en 2019, nous avons saisi l’opportunité d’un appel science ouverte de l’ANR pour tenter, avec le projet Anthropen1 , de penser collectivement, au sein de la discipline, les conditions de ce partage. Nous avons appelé ce mouvement « partage » (plutôt que restitution), car il nous semble que, éthiquement parlant, ces matériaux appartiennent à la fois aux chercheurs, chercheuses et aux communautés, puisqu’ils ont été co-construits sur le terrain. Tout comme le chercheur peut élaborer, à partir d’eux, une création de l’esprit (un article, un ouvrage) qui lui soit personnelle, leur co-constructeur (interlocuteur individuel ou collectif, expert ou non-expert) doit pouvoir faire de même. Dans le cadre de ce projet, nous nous sommes d’abord penchés de manière pratique sur une série de corpus ethnographiques tests issus des fonds du LESC : l’objectif était de penser les conditions permettant de réfléchir à leur ouverture, en posant les questions légales, en nous frottant aux contraintes techniques et aux contraintes du métier, dans le but de traduire un principe (l’ouverture des données de recherche promue par le mouvement pour une science ouverte) en nouvelles pratiques pour la discipline. Si ces cas limites n’épuisent pas les configurations des données auxquelles on peut être confronté, ils permettent néanmoins d’imaginer un ensemble de procédures capables d’accompagner le traitement de cette complexité.
Si l’on parle ici du besoin d’une traduction des principes de la science ouverte au-delà des réserves définies par le cadre juridique (qui n’est par ailleurs pas pleinement stabilisé), c’est parce que toutes les données anthropologiques ne correspondent pas à l’idéal type d’une donnée éthiquement et systématiquement partageable. Certaines recherches des plus pertinentes se font ainsi de manière discrète (sur les mouvements populistes par exemple), dans des milieux sensibles imposant des règles de confidentialité collective strictes (entreprises, armée), dans la sphère de l’intime (sexualités) ou dans des circonstances dangereuses pour les interlocuteurs (migration, criminalité) voire pour l’anthropologue lui-même (mafia, trafic). À ces appréciations liées à la sécurité des données que l’anthropologue peut émettre et des acteurs avec lesquels il interagit, s’ajoutent les appréciations de leurs interlocuteurs qui peuvent, pour des raisons et enjeux culturels, politiques ou personnels et tactiques, ne pas souhaiter leur mise à disposition. Il faut alors négocier la place de la frontière entre ouvert et fermé, en inventant une série de zones intermédiaires, à temporalité variable, qui peuvent retarder l’accès aux données et complexifier le traitement archivistique de ce patrimoine scientifique, mais qui sont indispensables pour que le partage (partiel ou futur) reste possible. Cette mise au diapason éthique et juridique a lieu, pour la plupart des données anthropologiques, au-delà des frontières nationales, dans un cadre multilingue, où les expertises en présence sont variables et où chaque corpus de données a son histoire propre. La mise en place d’ateliers de la donnée, convoquant autour de l’anthropologue des chercheurs locaux, des membres de communautés concernées, des juristes et des responsables de corpus, se révèle ici le cadre idéal pour discuter des limites et temporalités de l’ouverture, corpus par corpus, voire dans bien des cas, matériau par matériau.
La gestion de cette complexité dépend aussi de l’avancement des sciences et techniques de l’information, de leur durabilité et de leur coût. Nous n’avons pas encore évoqué la révolution digitale qui a permis de penser ce partage des données scientifiques à grande échelle : les outils numériques sont à la fois une formidable ressource et une entrave au partage. Une formidable ressource, car ils permettent le partage à distance – (une distance qui a souvent été dissuasive pour les restitutions dans les endroits éloignés de la planète), facilitent une meilleure communication via les traductions automatiques, favorisent le traitement en masse des données, économisant ainsi un temps précieux, encouragent le croisement des corpus et des méthodes de traitement, et modifient le travail collaboratif entre plusieurs chercheurs sur un même corpus. Mais cette technologie constitue aussi souvent une entrave, comme l’ont montré les ateliers, formations et entretiens organisés dans le cadre du projet : inquiétudes liées à l’insécurité des systèmes numériques et à leur absence de stabilité dans le temps, à la réutilisation possible des données à des fins potentiellement préjudiciables, à la dépersonnalisation et à l’assèchement des données via leur standardisation excessive, au coût d’entrée technologique trop élevé qui dissuade les chercheurs et chercheuses de se familiariser avec les outils informatiques et numériques qui présentent un risque d’obsolescence rapide, à la peur de la fragmentation numérique du corpus et donc d’une perte de contrôle sur son sens actuel et futur. Certaines de ces inquiétudes sont justifiées si l’on considère l’expérience vécue : de nombreuses données ont été numérisées et publiées en libre accès dans les années 2000, sur des plateformes devenues, avec le temps, obsolètes et incompatibles avec les nouvelles exigences FAIR (Facile à trouver, Accessible, Interopérable et Réutilisable), sans grand questionnement sur leur statut légal et sans négociation préalable avec les communautés, donc incompatibles avec les exigences CARE (Collective Benefit, Authority to Control, Responsibility, Ethics), ce qui apparaît en contradiction avec les principes portés par les pionniers du mouvement pour une science ouverte. En abandonnant ces dispositifs, on découvre aujourd’hui des plateformes et logiciels compatibles avec les exigences FAIR mais qui ne sont pas encore suffisamment adaptés au travail de co-construction des données en anthropologie.
Néanmoins, cette période de transition ne peut être dépassée avantageusement qu’en impliquant à toutes les échelles les chercheurs, chercheuses et responsables des corpus dans la définition de leurs besoins et priorités, et dans la prise en compte des changements épistémologiques qu’implique cette double révolution informationnelle et numérique. C’est la raison pour laquelle nous avons rejoint les réflexions menées par l’ÉquipEx+ Espadon, projet structurant et multidisciplinaire portant sur l’objet patrimonial augmenté. Nous espérons que les particularités de nos données y trouveront une place, afin que les frontières disciplinaires et nationales puissent être franchies dans le respect de la relation ethnographique au cœur de notre pratique.
Collectif ANR Anthropen :Monica Heintz, Jessica De Largy Healy, Florence Revelin, Sara Tandar, Hélène Gautier, Aude Da Cruz Lima, Esther Magnière, Frédéric Dubois, Nicolas Bontemps, Aurélie Helmlinger, Isabelle Donze
- 1Le programme Anthropen « Les frontières des données anthropologiques », coordonné par Monica Heintz (LESC), a été financé par l’ANR (2020-2022).