On appelle données de la recherche (DR) l’ensemble des informations collectées, observées ou créées sous une forme numérique ou non, par les chercheurs dans le cadre d’un projet de recherche et à partir desquelles ils bâtissent leurs hypothèses.
Elles sont un produit de la recherche, un élément de communication scientifique et regroupent un ensemble hétéroclite de sources et matériaux de recherche1.
Ainsi il existe :
- Les données primaires ou brutes (empiriques, observées, mesurées) dont certaines n’ont pas vocation à être stockées donc à être partagées ;
- Les données secondaires, dérivées des données primaires, annotées, enrichies, interprétées ajoutant de la valeur aux données initiales et pouvant impliquer d’autres acteurs. Elles sont traitées, analysées ;
- Les métadonnées qui structurent, gèrent, facilitent l’accessibilité des données primaires et secondaires et informent sur les conditions de partage.
Éléments concrets dont la communauté scientifique admet communément la nécessité pour documenter et valider les résultats de recherche, les DR concernent, en plus des métiers de la recherche, les métiers qui viennent en appui à celle-ci (la documentation, les archives, l’informatique, l’information scientifique et technique, ...).
Chacun de ces métiers a un rôle essentiel dans le cycle de vie des données.
On peut les définir en fonction de différents critères :
➫ En fonction de leur nature ou forme
- Texte (questionnaires, retranscription d’entretien, procédures, protocoles, journal de bord…)
- Numérique (réponses à des tests ou enquêtes, données médicales, mesures, relevés…)
- Multimédia (sons, vidéos, images…)
- Codes de développement (codes sources, algorithmes, scripts…)
- Propres à des disciplines spécifiques
➫ En fonction de leur niveau d’élaboration
- Données brutes (données collectées, non organisées, non mises en forme) - appelées aussi données chaudes.
- Données traitées (organisées, structurées et prêtes à être analysées) - appelées aussi données chaudes.
- Données analysées (telles qu’elles apparaissent dans les publications) - appelées aussi données froides.
1Julie Duprat. Les données de la recherche à l’Université Bordeaux Montaigne : Synthèse d’une enquête qualitative auprès des chercheurs. [Rapport de recherche] Université Bordeaux Montaigne. 2019. hal-02020141