Les articles scientifiques des chercheurs et chercheuses en sciences humaines et sociales au CNRS en libre accès entre 2020 et 2022
#NOUVELLES DE L'INSTITUT
CNRS Sciences humaines & sociales a développé depuis plus d’une dizaine d’années l’outil RIBAC1 , pour recueillir directement auprès des chercheurs et chercheuses les données sur leurs publications scientifiques, quels que soient les supports, revues ou ouvrages et sur l’ensemble de leurs activités. Le rapport d’activité RIBAC est renseigné chaque année par près de 99 % des chercheurs. À partir des données collectées dans les RIBACs, l’institut publie tous les ans sur son site web et dans le rapport d’activité du CNRS, des données et des analyses sur les publications des chercheurs et chercheuses en sciences humaines et sociales.
- 1RIBAC - Recueil d’Informations pour un oBservatoire des Activités de reCherche en SHS.
Afin de promouvoir la science ouverte, le CNRS a publié en novembre 2019, sa feuille de route pour la science ouverte. Dans ce cadre, dès 2020, Il a été demandé aux chercheurs et chercheuses CNRS en sciences humaines et sociales d’enregistrer les références de leurs d’articles et chapitres d’ouvrages au préalable dans HAL pour les transférer ensuite dans leur fiche RIBAC.
À partir de la campagne RIBAC 2021, l'alimentation du rapport d'activité des chercheurs et chercheuses CNRS se fait en ajoutant dans HAL le texte intégral des articles de revues scientifique, sur la base des dispositions de la loi pour une République Numérique.
Cet article propose une analyse de l’évolution du taux d’articles scientifiques en libre accès des chercheurs et chercheuses en sciences humaines et sociales au CNRS entre 2020 et 2022.
Méthodologie
Les données sur lesquelles reposent les résultats ci-dessous ont été extraites de la rubrique 2.2 « publications scientifiques » des RIBACs des chercheurs et chercheuses de l’institut. Ceux-ci indexent eux-mêmes leurs publications à l’aide d’une liste fermée de 27 disciplines en sciences humaines et sociales. C’est la classification européenne de la European Science Fondation (ESF) en 27 catégories qui a été utilisée. Les données de publication sont déclaratives et ont été nettoyées par le pôle RIBAC de CNRS Sciences humaines & sociales. Ont été principalement vérifiés l’année de publication, le type de document (article si présence d’un ISSN), la nature de l’article (scientifique / non scientifique) et les identifiants DOI (Digital Object Identifier) manquants des articles ont été ajoutés s’ils existaient. Seules les publications de l’année calendaire sont prises en compte pour les calculs.
Pour le comptage de la part des publications ouvertes, CNRS Sciences humaines & sociales a travaillé avec les équipes du Baromètre français de la Science Ouverte (BSO) du ministère de l’Enseignement supérieur et de la Recherche (MESR) et de l’Institut de l'information scientifique et technique (Inist) du CNRS. Après plusieurs échanges et contrôles, les fichiers des articles scientifiques déclarés en 2020, 2021 et 2022 par les chercheurs et chercheuses de l’institut ont été enrichis avec un certain nombre d’informations comme la présence en libre accès et le type de libre accès (archive ouverte et/ou site éditeur). Il est à noter que la méthode utilisée par les équipes du BSO et de l’Inist pour repérer une publication en libre accès est basée sur la présence d’un DOI attribué uniquement par l’agence Crossref et le statut des publications renseignées dans l’outil UnpayWall qui moissonne des sites éditeurs et des archives ouvertes comme HAL. À titre d’information, l’Inist attribue des DOI DataCite qui sont différents des DOI Crossref et plutôt utilisés pour les corpus de données. Mais les DOI Crossref sont les DOI les plus utilisés par les grands éditeurs de revues.
Résultats
Taux d’ouverture global des articles scientifiques
Compte tenu de la méthodologie utilisée, basée sur la présence d’un DOI crossref, l’analyse du taux de libre accès des publications a été réalisée uniquement sur les articles scientifiques qui présente un taux de DOI suffisant (autour de 80 %) pour pouvoir appliquer la méthode. La proportion d’articles scientifiques possédant un DOI a évolué de 77 % en 2020 à 84 % en 2022 (Tableau 1).
En revanche, même si le taux de DOI augmente depuis 2020, il reste relativement faible pour les chapitres d’ouvrage (a évolué de 31 % en 2020 à 44 % en 2022) pour pouvoir appliquer la méthode basée sur la présence d’un DOI.
Le taux de publication en libre accès pour les articles collectés dans les rapports d'activité RIBAC des chercheurs et chercheuses de CNRS Sciences humaines & sociales en 2020, 2021 et 2022 (sources RIBAC et BSO) est présenté dans le tableau 1. Les enrichissements des informations concernant le libre accès ont été faits tous les ans en mai de l’année N+1,5 par rapport à l’année de publication (par exemple : analyse en mai 2024 pour les publications de 2022) pour pouvoir comparer les résultats d’une année à l’autre. En effet, le taux d’ouverture des publications augmente au cours du temps.
On constate que le taux d’ouverture des publications 2021 a augmenté de 17 points par rapport aux publications 2020 et qu’il semble se stabiliser autour de 85 % pour les articles 2022.
Si l’on compare ces résultats des chercheurs et chercheuses CNRS en sciences humaines et sociales avec les résultats du taux d'accès ouvert des publications scientifiques françaises, avec un DOI Crossref, parues durant l'année précédente par année d'observation publiés par le BSO, on observe également cette stabilisation du taux d’ouverture des publications 2022. Pour l’ensemble des publications françaises quel que soit le domaine disciplinaire, le taux d’ouverture semble se stabiliser autour de 65 % (contre 85 % pour les chercheurs et chercheuses CNRS Sciences humaines & sociales).
Si l’on tient compte du nombre total d’articles déclarés dans RIBAC et pas uniquement du nombre d’articles possédant un DOI Crossref, le taux d’ouverture diminue et se situe à 69 % pour 2022. Néanmoins, cette diminution est difficile à interpréter car nous n’avons aucune information sur l’ouverture des 20 % d’articles scientifiques qui n’ont pas de DOI Crossref.
Entre 2020 et 2022, on remarque une baisse notable de plus de 20 % du nombre d’articles de revue déclarés par les chercheurs et chercheuses dans leur RIBAC (de 2363 à 1877). Cela traduit vraisemblablement, au moins pour une partie, les difficultés rencontrées (et observées par le support RIBAC) par les chercheurs et chercheuses pour déposer le texte intégral des articles scientifiques dans HAL, qui doit répondre à des critères à la fois techniques et légaux pas toujours simples à appréhender. Ces difficultés se sont matérialisées par une augmentation très importante du nombre de messages reçu par l’assistance RIBAC. Dès la campagne 2020, le support RIBAC a échangé environ 3 000 messages, soit 100 % de messages supplémentaires par rapport à la campagne 2019. La majorité de ces messages supplémentaires concernait les dépôts sur HAL et les liens avec l’outil RIBAC comme, par exemple, l’impossibilité d’importer dans RIBAC les métadonnées de l’article si le texte intégral n’a pas été ajouté dans HAL, les difficultés pour reconstruire la version postprint de son article, le fait de ne pas attendre le retour de la modération HAL pour importer les métadonnées dans RIBAC, ou encore le type de version à déposer (préprint, postprint ou version éditeur2 ) en fonction de la politique de l’éditeur de la revue. Pour la campagne 2022, le nombre de messages a légèrement diminué mais représentait encore 70 % de messages supplémentaires par rapport au nombre de messages reçus en 2019. Par ailleurs, un certain nombre de chercheurs et chercheuses ne souhaitent pas déposer la version préprint de leur manuscrit sur HAL, c’est-à-dire la première version soumise à un éditeur, car elle n’a pas encore été relue par les pairs.
Taux d’ouverture des articles en fonction des sections du comité national des chercheurs et chercheuses
La répartition des articles scientifiques en libre accès a été analysée selon les sections du comité national auxquelles sont rattachés les chercheurs et chercheuses pour les années 2020 à 2022. Le taux d'accès ouvert est présenté en fonction de la section du chercheur dans la figure 1 et dans le tableau 2.
Comme habituellement dans la communauté des sciences humaines et sociales, il y a de fortes différences de pratiques selon les communautés. Pour les linguistes (section 34), les économistes (section 37) et les géographes (section 39), le taux d’ouverture des articles est relativement stable entre 2021 et 2022 autour de 90 %, plus élevé que la moyenne des SHS autour de 85 %. Pour cette même période ce taux d’ouverture est inférieur de presque 15 points autour de 75 % pour les historiennes de la section 33 et pour les chercheurs et chercheuses de la section 35 (Tableau 2). Ce résultat peut être rapproché du profil de publications de ces différentes communautés SHS. Pour les linguistes et économistes du CNRS, plus de la moitié de leurs publications se fait sous la forme d’articles de revue et document de travail (sorte de préprint) alors que le support « revue » représente seulement environ 20 % des publications des historiens modernes et contemporains et des chercheurs en philosophie, littératures et art (Figure 2).
Taux d’ouverture des articles en fonction du domaine disciplinaire
Pour définir plus finement les pratiques de publication par domaine disciplinaire, est présenté dans le tableau 3 le taux d’ouverture des articles en fonction des 27 disciplines SHS. L’étude a été faite sur les 1 800 articles publiés en 2022 et indexés par les chercheurs eux-mêmes dans leur RIBAC ; 77 articles n’ont pas été indexés. Les résultats sont proposés selon un comptage fractionné car un article peut être indexé par le chercheur avec plusieurs domaines disciplinaires.
On retrouve les communautés déjà identifiées comme les linguistes (section 34), économistes (section 37) et géographes (section 39) qui publient des articles dont le taux d’ouverture est autour des 90 %. Certains groupes disciplinaires plus transversaux et interdisciplinaires apparaissent également comme ayant un taux d’ouverture de leur articles supérieur à la moyenne des SHS comme les chercheurs et chercheuses en psychologie, en anthropologie biologique, les spécialistes de statistiques et informatique et ceux qui étudient les milieux naturels et anthropisés.
Avec cette cartographie disciplinaire, on observe également à nouveau que les articles scientifiques en histoire et philosophie ont des taux d’ouverture autour de 75 %. De nouvelles disciplines de recherche SHS comme les sciences de l’éducation et la théologie sont aussi identifiées comme ayant un taux d’ouverture de leurs articles inférieur à la moyenne des SHS.
Cette représentation permet aussi de mettre en évidence des différences notables quant à la proportion d’articles de revue scientifiques SHS possédant un DOI crossref. En moyenne, 81 % des articles SHS publiés par les chercheurs et chercheuses CNRS en 2022 possède un DOI crossref (Tableau 1). Le taux d’articles avec un DOI crossref est plus proche des 70 % pour les articles publiés dans les domaines liés à l’histoire et la littérature (Tableau 3).
Mode d’ouverture des articles en libre accès
Pour les 1 288 articles scientifiques 2022 identifiés en libre accès avec un DOI Crossref (Tableau 1), 63 % de ces articles le sont sur un site éditeur et 90 % dans l’archive ouverte HAL.
L’analyse des modes de libre accès selon les sections du comité national auxquelles sont rattachés les chercheurs et chercheuses (archive ouverte ou éditeur3 ) montre également des différences entre les communautés (Tableau 4).
La mise en libre accès des articles scientifiques des économistes de la section 37 (Tableau 4) se fait surtout (pour 98 % des articles) par le biais d’un dépôt dans une archive ouverte, principalement avec des versions de working papers (sorte de préprint publié dans des collections de revues de laboratoire soumis à la communauté avant publication dans des revues de référence). Moins de la moitié de leurs articles (44 %) sont disponibles en libre accès sur le site d’un éditeur. A contrario, plus des 3/4 des articles de revue en libre accès le sont sur un site éditeur (Tableau 4) pour les archéologues de la section 31, les anthropologues (section 38), et les géographes (section 39). Cette observation est à rapprocher de la politique éditoriale des revues et le développement de la voie diamant, qui permet de publier en accès ouvert et sans frais dans des revues financées en amont et qui est recommandée par le CNRS et, pour ses communautés, par CNRS Sciences humaines & sociales depuis longtemps.
Conclusion
Compte tenu du nombre faible de DOIs attribués à l’ensemble des productions SHS, la méthode d’analyse ici proposée concernant uniquement les articles scientifiques est à considérer avant tout comme un outil méthodologique et les résultats sont à prendre comme des tendances. Sans doute peut-on estimer que le taux d’ouverture des chapitres d’ouvrage doit être plus faible que celui des articles scientifiques avec DOI crossref. De plus, des bugs ont été recensés et faussent légèrement les résultats sur les articles.
Il faut souligner aussi que le nombre d’articles scientifiques déclarés en 2022 dans les RIBACs a diminué de 20 % par rapport à 2020. Cela traduit vraisemblablement les difficultés rencontrées (et observées par le support RIBAC) par les chercheurs et chercheuses pour déposer le texte intégral des articles scientifiques dans HAL, qui doit répondre à des critères à la fois techniques et légaux pas toujours simples à appréhender.
Ces résultats ne concernent donc que les articles de revue, soit environ 40 % des publications scientifiques en sciences humaines et sociales. Malgré ces limitations, ce taux d’ouverture de 85 % est encourageant et supérieur à celui observé sur l’ensemble des publications françaises 2022 par le baromètre français de la science ouverte (BSO) avec la même méthodologie. La mise en place dès 2021 de la nouvelle politique du CNRS relative au dépôt dans HAL des textes intégraux pour les articles scientifiques a été efficace et a permis d’augmenter de 17 points le taux d’ouverture des articles par rapport à 2020. Ce taux semble se stabiliser autour de 85 % pour les articles 2022.
L’étude a permis de montrer, comme habituellement, des différences de pratiques de publication et de politique éditoriale entre les communautés disciplinaires, à la fois en terme de taux d’ouverture des articles scientifiques plus ou moins important mais aussi sur le mode d’ouverture utilisé : archives ouvertes (voie verte) ou site éditeur (voie dorée/voie diamant/voie hybride/voie bronze). La communauté des économistes se rapproche des pratiques des chercheurs et chercheuses en sciences de la matière avec un dépôt de la quasi-totalité de leurs articles scientifiques sur l’archive ouverte HAL sous forme de working papers. La communauté des géographes est toujours en pointe avec plus des ¾ de ses articles en libre accès sur le site d’un éditeur.
La présentation du taux d’ouverture à un niveau de granularité plus fin a permis de percevoir des variations à l’intérieur des domaines disciplinaires des sections du comité national. Elle a également mis en évidence des pratiques éditoriales et d’attribution de DOIs différentes selon les communautés des sciences humaines et sociales.