COS : Les coûts de l’Open Science, un impensé ?

2024

Redonner de la visibilité et de la valeur au travail d’ouverture de la science (publication et données)

Il s’agit dans cette recherche de rendre visible tout le maillage des tâches et des espaces temporels dans lesquels le « travail d’ouverture » se fait, et d’observer si cela donne lieu à une forme de « retour sur investissement » ou « d’externalité positive » en termes de réutilisation et dons de visibilité ou de reconnaissance pour le chercheur. L’originalité de cette recherche est d’aborder cette question à partir des structures temporelles qui soutiennent le travail d’ouverture de la science, qui en restituent en creux la richesse et la complexité, dans sa dimension individuelle, collaborative, communautaire, mais aussi numérique (recours à des standards et des plateformes ou infrastructures dédiées). Que ce travail soit fait dans la contrainte ou dans la vocation, il s’agit de lui redonner de la visibilité pour lui attribuer de la valeur. De manière corollaire, notre recherche vise à investiguer la valeur accordée par le chercheur à son travail d’ouverture et la valeur symbolique qu’il en retire, une fois ce travail accompli. Un autre objectif de la recherche est de nourrir le débat autour de la reconnaissance de la mise en conformité des pratiques de la recherche aux principes de la Science Ouverte à partir d’un faisceau de données empiriques permettant de confronter la réalité dynamique du phénomène avec les discours et les représentations des chercheurs mais aussi des organisations qui en font la promotion et annoncent des effets positifs sur la science qui ne sont encore que des promesses, et dont il faudrait bien tenter de mesurer si elles se réalisent ou non. Il s’agit en somme de ne pas prendre pour acquis les discours sur les effets supposés bénéfiques de la science ouverte mais de voir dans le détail comment cela peut se faire dans la réalité complexe du système de la recherche scientifique, tel qu’on le connait.

 

Terrain et méthodologie

La recherche sera menée sur deux terrains, la France et le Québec, dans une approche comparatiste. Le but est de comprendre de quelle manière des critères endogènes et exogènes interviennent dans la représentation et l’estimation des coûts et de la nature des coûts d’ouverture de la science, plus particulièrement dans celui de l’ouverture des données. De la même façon, il s’agit de comprendre dans quelle mesure les différences entre les deux terrains influent sur les perceptions et estimations des coûts associés dans le travail d’ouverture de la recherche et de ses résultats. A cet effet, deux corpus de revues seront mobilisés :

  • Le premier corpus est composé des articles québécois et français publiés dans la revue Plos One qui est une des premières à publier des articles associés à des jeux de données, présentées sous forme de Supplementary Materials (Extraction Web of science)
  • Le deuxième corpus est composé des articles québécois et français dans la revue Data in Brief qui publie des Data Papers depuis 2014, mais aussi ceux identifiés depuis 2016 dans le Web of Science, tous domaines confondus.

Ces deux corpus seront soumis à deux méthodes distinctes (bibliométrique et sociologique), croisées dans le but de répondre à nos questions de recherche. Ces méthodes relèvent respectivement d’approches quantitatives descriptives et qualitatives interprétatives. Cette démarche a pour objectif d’appréhender au mieux et au plus proche de la dynamique de l’Open Science, traitée ici comme une pratique, voire une stratégie du chercheur, qui par définition est vouée à évoluer.

Fondée sur l’analyse des corpus français et québécois collectés, la méthode bibliométrique visera à observer et à analyser les différences de visibilité et d’usages réelles des données ainsi mises à disposition et ce dans leur évolution temporelle. De la même façon, il s’agira de rendre compte des différences de visibilité et d’usage par domaine de recherche. Une attention toute particulière de l’analyse sera apportée aux Sciences Humaines et Sociales dont la problématique des données ouvertes est différente et souvent plus complexe.

L’analyse sociologique visera à réaliser une enquête auprès des auteurs français et québécois identifiés aux articles des deux corpus dans le but de réaliser dans une première étape des entretiens semi-directifs, puis dans une seconde étape un questionnaire s’adressant à l’ensemble de l’autorat français et québécois des deux corpus. Ce volet s’attachera à recueillir les discours et les représentations des chercheurs quant aux demandes d’ouverture qui leur sont adressées, mais aussi à recueillir la nature des arguments qu’ils mobilisent pour justifier leur motivation réelle à le faire. De même, les gestionnaires seront interrogés sur leurs propres représentations de la Science Ouverte pour mieux comprendre en quoi ils pensent que cela va avoir des effets positifs ou négatifs sur la dynamique de la science. Cette double analyse permettra de situer la question des coûts impliqués et de mieux comprendre les tensions entre les apports potentiels des pratiques d’ouverture et leurs limites, voire leurs contraintes. Ce phasage méthodologique déjà employé dans le projet Harbinger mené par David Nicholas (Nicholas et al, 2019 ; Nicholas et al. 2022) permettra de traiter en profondeur des évènements de publication des données par les chercheurs, pour mieux identifier et comprendre les structures temporelles au sein desquelles ce travail est réalisé, y compris dans ses contraintes linguistiques. Nous mènerons également des entretiens avec des responsables institutionnels d’implémentation des politiques de Science ouverte pour mettre en évidence leur degré de connaissance des obstacles réels à leur mise en application et aux coûts impliqués. Des résultats préliminaires nous portent en effet à penser que bien des gestionnaires sous-estiment grandement les obstacles et les effets réels de la mise à disposition des données de recherche. In fine, en croisant les résultats des deux versants méthodologiques du projet, nous établirons une cartographie dynamique de la pluralité des facteurs qui interviennent dans le dimensionnement des coûts de l’ouverture, l’intensité de leur intervention et la nature de leur justification.

 

 

Mots-clefs : Circulation des savoirs, Communication scientifique, Données de la recherche, bibliométrie, communautés scientifiques, enquête, information scientifique, édition

Responsable(s) scientifique(s)

Chérifa BOUKACEM ZEGHMOURI

Financement

GIS URFIST

Lien vers le projet financé par le GIS : https://gisurfist.hypotheses.org/508