Aller au contenu principal

Données de la recherche

Quelques ressources pour vous accompagner dans la gestion des données de la recherche

Des services vous accompagnent à AMU

Cellule Science Ouverte du Service Commun de Documentation (SCD)

 

Besoin d’aide ?

La cellule Science Ouverte vous répond à l’adresse scd-science-ouverte[@]univ-amu.fr pour toute question sur la Science Ouverte et les données de la recherche.


Liste de diffusion
 
Restons en contact ! Nous diffusons de l’information sur la Science Ouverte et les Données, à AMU et au-delà, sur notre liste « scd-donnees-recherche ». Chaque abonné peut y partager ses expériences, poser des questions, faire des remarques...  Lien pour vous inscrire.

Accompagnement à la rédaction de plan de gestion des données

  • Vous ne savez pas comment rédiger un plan de gestion des données ?
  • Vous vous demandez quel outil utiliser ?

N’hésitez pas : pour toutes les questions sur le plan de gestion des données, écrivez à scd-assistance-dmp[@]univ-amuf.fr

 
DMP OPIDoR pour la rédaction des plans de gestion des données
AMU dispose d’un espace institutionnel sur DMP OPIDoR. Inscrivez-vous avec votre identifiant RENATER et votre compte DMP OPIDoR sera lié à votre compte institutionnel (saisir AMU comme organisme de rattachement > voir capture).
Vous pourrez profiter de recommandations AMU pour rédiger vos PGD. En savoir plus
Contactez-nous pour plus d’informations !
 
Tutoriels
Vous cherchez des informations sur le plan de gestion des données ? Vous n’avez ni le temps ni la possibilité de participer à une formation ? Nos tutos vous accompagnent ! RDV sur notre blog...
  • Qu’est-ce que le plan de gestion des données ?  À quoi sert-il ? Quand le rédiger ? Qu’apporte-t-il à mon projet de recherche ? Réponse ici !
  • Selon vos besoins, 4 tutoriels pour 4 étapes avec DMP OPIDoR : 1. Découvrir l’outil, 2. Créer son premier plan, 3. Le modifier et l’enrichir, 4. Le partager et le télécharger. Par ici !

Rédaction d’AAP pour projets européens
 
Pour les appels à projet Horizon Europe, la gestion des données de recherche est explicitement mentionnée et doit donc être abordée par les auteurs pour montrer que des mesures sont en place. Il faut donc dès le montage du projet se positionner sur ces questions. Nous vous proposons de consulter un dossier qui contient un glossaire, des conseils et une trame commentée de PGD Europe : https://amubox.univ-amu.fr/s/PyYqEaFXXcB3CZf
 
De plus, il existe un très bon guide pour traiter les aspects Science Ouverte dans les dossiers Horizon Europe. Publié par OpenAIRE, il vous accompagne pour traiter les aspects de Science Ouverte (publications et données) dans les dossiers Horizon Europe. Lien vers le site.

Protection des données à caractère personnel

 

Service des délégués à la protection des données (DPO)

Avec une fonction située au coeur de la conformité au règlement européen sur la protection des données (RGPD), le délégué à la protection des données (DPO) conseille et accompagne les organismes qui le désignent dans leur conformité.

Le/La DPO, pour « Data Protection Officer », est la personne en charge de la protection des données à caractère personnel au sein des organismes publics ou privés. Il/Elle sera également l’interlocuteur privilégié pour toutes les questions relatives aux données personnelles, qu’elles soient internes ou qu’elles émanent d’une personne concernée par un traitement effectué par l’organisme. Ainsi, le/la DPO sera en charge de la gestion des demandes d’exercice des droits.


Saisine du DPO à AMU

Vous souhaitez formuler une demande d’aide personnalisée auprès du DPO d’AMU ? Suivez la procédure étape par étape.

Que vous soyez étudiant, membre du personnel, chercheur, enseignant-chercheur, ou simple visiteur de son site Web, Aix-Marseille université souhaite vous offrir la meilleure protection de vos données personnelles. À cette fin, et en conformité avec le règlement européen (UE) 2016/679 du 27 avril 2016 (RGPD) et de la loi Informatique et libertés du 6 janvier 1978 modifiée, vous pouvez saisir l’équipe DPO d’AMU en cliquant sur le lien suivant : https://ent.univ-amu.fr/esup-helpdesk/stylesheets/welcome.faces?args=page%3daddTicket%26categoryId%3d2433

Comité d’éthique

 

Le monde de la recherche est un monde en constante évolution qui place le chercheur face à des défis et des situations qui le mettent souvent en position de choix : « Que dois-je faire? » « Quelle direction prendre? ».

Le Comité d’éthique, lieu d’échanges pluridisciplinaires, a pour mission d’accompagner et de conseiller les porteurs de projets sur leur démarche scientifique.


Accompagnement et démarches

Présidé par le Professeur Pierre-Jean Weiller, le Comité d’Ethique d’AMU, composé d’un collège sociétal et d’un collège médical, a pour vocation de réfléchir aux enjeux éthiques portés par les protocoles de recherche présentés. Son rôle est d’offrir une évaluation concrète de la conformité éthique des projets de recherche portés par la communauté scientifique d’AMU.

Le Comité d’éthique rend un avis écrit sur le protocole de recherche soumis pour évaluation.


Important

Il n’a a aucune obligation à priori d’obtenir un avis éthique. Le comité accompagne l’investigateur dans sa démarche scientifique pour que celle-ci soit juste, et bienveillante au regard des personnes qui vont participer à l’étude.

De plus en plus de revues demandent au moment de la publication un tel avis, si la démarche d’avis éthique n’a pas été anticipée le porteur sera donc dans l’impossibilité de publier car le comité d’éthique ne donne pas d’avis sur une étude déjà réalisée.

Donc il est toujours plus prudent d’obtenir un avis éthique avant tout démarrage de projet.


Éthique et législation nationale

1 - COMPÉTENCES DE LA LOI JARDE ET DES COMITÉ DE PROTECTION DES PERSONNES

Les projet de recherche impliquant la personne humaine relève de La loi Jardé n° 2012-300 du 5 mars 2012 ( art L.1121-1 du CSP fixe 3 catégories de recherche relevant de la compétence d’un comités de protection des personnes.

Compétences et Procédure de saisine d’un des 39 CPP.

Les comités s’assurent notamment :

  • que la protection des participants à la recherche impliquant la personne humaine est respectée (information préalable, recueil du consentement, période d’exclusion, délai de réflexion…),
  • que la recherche est pertinente,
  • que l’évaluation du rapport bénéfice/risque est satisfaisant.

 La loi dispose (article L. 1121-4 du CSP ) que tous les projets de recherche impliquant la personne humaine (RIPH) ne peuvent être mis en œuvre qu’après un avis favorable d’un comité de protection des personnes (CPP).

Le CPP compétent pour examiner chaque projet est désigné aléatoirement (article L. 1123-6 du CSP ).

À compter du 26 mai 2021 il faut se rendre sur la plateforme du SI RIPH2G pour déposer une demande d’avis pour un projet RIPH : https://siriph.sante.gouv.fr/si-riph-2g/#/login

 

2 - HORS LOI JARDE ET COMPÉTENCE DU COMITÉ ÉTHIQUE

Ne sont pas des recherches impliquant la personne humaine au regard du II de l’article R1121-1 du code de la santé publique :

  • Les recherches non interventionnelles portant sur des données, les études rétrospectives sur données et sur échantillons biologiques qui doivent, en revanche, être conduites en conformité avec la législation en vigueur sur les traitements de données personnelles : règlement général sur la protection des données (RGPD) et loi Informatique et libertés.

  • Les enquêtes : sur les « modalités d’exercice » des professionnels de santé et celles sur les « pratiques d’enseignement en santé » : enquêtes de satisfaction auprès des patients, évaluation de pratiques médicales et paramédicales, recherche dans le domaine social, recherche sur les pratiques professionnelle d’enseignement, soins, organisation des soins, enquêtes d’opinion, observation pure dans le champ des sciences sociales, ethnologie ou éthologie.


Collecte de données personnels et Règlement européen pour la protection des données - RGPD

Monsieur Hervé Isar, Professeur des universités, est Délégué à la protection des données pour AMU.

Merci de bien vouloir déclarer toutes vos recherche utilisant des données personnelles au DPO avec dans l’objet: le titre de votre recherche.

Saisine DPO AMU : https://www.univ-amu.fr/fr/public/procedure-saisine-dpo

Attention : L’usage des outils informatiques et internet Google comme : - Googleform - Google analytics - Gmail … induit nécessairement un transfert des données personnelles collectées vers les États-Unis dans la mesure où le siège social de Google LLC se situe en Californie.


Préparations et conservations ou des importations et exportations d’échantillons biologiques humains destinés à la recherche

Vous devez faire une déclaration sur le site CODECOH du Ministère de la Recherche: CODECOH (education.fr)


Différents formulaires

À remplir pour toute demande d'avis auprès du Comité (documents envoyés en word ou pdf, aucun scan ne sera traité)

1- Notice d’information au patient
2- Formulaire de recueil du consentement
3- Fiche projet de recherche : attention les parties Bibliographie, État de l’art et Méthodologie doivent être remplies avec soin.
4- Notice d’information pour enfants mineurs
5- Le ou les questionnaires si nécessaire.


Liens utiles

https://www.univ-amu.fr/fr/public/comite-dethique

SAISINE de la CNIL : Procédure de déclaration devant le correspondant informatique et libertés (CIL) d’un fichier de données à caractère personnel MR003 pour les données de santé ou MR004 pour les données à caractères personnelles.

La Plateforme Universitaire de Données d’Aix-Marseille Université

 

La PUD-AMU, pour les études méditerranéennes, se trouve à la Maison Méditerranéenne des Sciences de l’Homme (MMSH) à Aix-en-Provence et s’adresse aux chercheurs, doctorants et étudiants en Sciences Humaines et Sociales. Elle accompagne la communauté scientifique dans la recherche et l’utilisation des données quantitatives, leur traitement logiciel et leur analyse statistique.
La spécificité de la PUD-AMU est l’expertise en données quantitatives pour l’aire méditerranéenne.


Missions

La très grande infrastructure de recherche (TGIR) PROGEDO a pour but de développer la culture des données, d’impulser et structurer une politique des données d’enquêtes pour la recherche en sciences sociales.

Cette initiative nationale s’appuie sur des plateformes de données, implantées dans plusieurs universités françaises. Ces plateformes (PUD) prolongent localement l’action de PROGEDO pour apporter un soutien direct aux utilisateurs de données quantitatives en Sciences Humaines et Sociales.

La PUD-AMU fournit un accompagnement et des conseils personnalisés aux différentes étapes d’une recherche mobilisant des données quantitatives (connaître les données existantes, obtenir et traiter les données, interpréter les résultats obtenus).

La PUD-AMU a également pour mission d’organiser des formations pour des groupes.


Public

La PUD est ouverte aux personnels et usagers d’Aix-Marseille Université :

  • Enseignants-chercheurs
  • Chercheurs
  • Personnels administratifs et techniques
  • Doctorants
  • Étudiants de master

Lien du site : https://pud.mmsh.univ-aix.fr/

Contact : pud-amu@univ-amu.fr

Datacenter SUD (DC SUD)

À propos du Datacenter

Le DC SUD est situé sur le campus Étoile de l’Université d’Aix-Marseille. Labellisé par le MESRI il vise à répondre, à travers son offre de services, à des besoins numériques (recherche, pédagogie, administration) en constante progression.

Son rôle est de maintenir un haut niveau de sécurité et de disponibilité des services en s’appuyant sur la mutualisation des compétences et des moyens financiers.

Lien vers le site : https://datacentersud.univ-amu.fr/


Qui ?

L’équipe s’appuie intégralement sur les compétences de la DOSI d’Aix-Marseille Université et regroupe principalement les équipes des pôles :

  • Réseau : réseau métropolitain RAIMU, réseaux routés et sans-fil d’AMU, nombreuses solutions de sécurité périmétriques.
  • Système : solutions techniques et services numériques : référentiel d’authentification, messagerie, plateformes de streaming et de visioconférence, solution de virtualisation de poste de travail …
  • Administratif : RH, finances, traite l’intégralité du workflow DC SUD des conventions ou des accords de service jusqu’à leur facturation.

Leurs domaines d’activité et d'expertise sont multiples dans un environnement à grande échelle ce qui leur permet de prendre en charge l’intégralité des process de mise à disposition des services numériques : conception ; mise en œuvre, maintien en condition opérationnelle et évolution ; support.

L’offre de services

Hébergement physique

L’offre de service concernant l’hébergement physique est multiple :

  • un hébergement au sein de baies informatiques mutualisées (Rack), cette solution est idéale si vous avez 1 à 5 serveurs à gérer.
  • des baies (45 U) ou demi-baies (23 U) dédiées et sécurisées, vous êtes en totale autonomie, idéal pour les entités avec un fort degré d’exigence.

Pour l’ensemble de ces solutions, vous bénéficiez de deux circuits d’alimentation obligatoires (Alimentation redondante) et de deux liens réseau distincts 1Gbits RJ45 : 1 pour l’accès console, l’autre pour l’accès serveur et  en option fortement recommandée un double attachement (Agrégat LACP) au réseau du DC SUD.

Les équipes du DC SUD suivent les accès, le refroidissement, la puissance électrique et bien plus encore.

Si vous souhaitez avoir plus d’informations : formulaire de contact.


Hébergement virtuel

L’offre de service concernant l’hébergement virtuel vous permet de bénéficier de la puissance des infrastructures virtuelles du DC SUD.

  • Mise à votre disposition d’une machine virtuelle Linux sur mesure jusqu’à 4 vCPU, 16 Go de RAM et 1 To d’espace disque performant.
  • « Protection PRA » : serveur répliqué toutes les 4 heures sur un second site distant. (Possibilité de serveurs Windows uniquement pour les entités AMU).

Si vous souhaitez avoir plus d’informations : formulaire de contact.


Hébergement Web

Réservée uniquement aux entités AMU pour le moment et sous condition d’éligibilité, l’offre de service d’hébergement web (Platform As A Service) propose la mise à disposition d’un espace composé :

  • d’un quota de 20 Go global pour le dépôt de vos sources et de votre base de données ;
  • d’un interpréteur PHP sélectionnable à la demande ;
  • d’un panneau de contrôle d'hébergement web basé sur Virtualmin qui permet une gestion facilitée de votre base de données, de votre site web.

Si l’infrastructure logicielle et matérielle sous-jacente est intégralement maintenue par l’équipe du DC SUD, l’hébergé est dans l’obligation de maintenir techniquement la sécurité de son code ou de son CMS à jour.

Si vous souhaitez avoir plus d’informations : formulaire de contact.


Solutions de stockage

L’offre de service concernant les solutions de stockage est multiple :

  • solution de type bloc performante toujours associée à l’offre de service des serveurs virtuels dans la limite de 1To ;
  • solutions de type fichiers à très large volumétrie avec des accès par les protocoles SMB V3 et NFS V4 en mode authentifié sur les référentiels d’authentification classiques : LDAP ou AD ;
  • pour les établissements AMU, un accord de service de délégation d’une OU de l’Active Directory d’AMU peut être signé sous conditions ;
  • À venir : offre de stockage de type objet nativement basé sur S3, permettant à terme du stockage très capacitif avec des durées de rétention très longue (stockage froid).

Pour l’ensemble de ces solutions, une option PRA (Plan de Reprise d’Activité) est disponible. Elle permet de répliquer automatiquement et de façon récurrente une partie ou l’ensemble de vos données sur un site distant et de redémarrer votre activité en cas d’indisponibilité prolongée de la salle principale du DC SUD.

Si vous souhaitez avoir plus d’informations : formulaire de contact.

Centre de formation et de soutien aux Données de la REcherche

 

CEDRE, regroupe des experts informatique pour soutenir les acteurs de la recherche de notre université, sur les questions techniques en matière de gestion des données. 

Partie intégrante du projet structurant IDeAL, le rôle de ce centre est de développer une culture et des compétences digitales de pointe. Pour permettre à la communauté d’exploiter le plein potentiel de nos données, CEDRE vise à :

  • apporter une expertise sur les nouvelles pratiques en gestion de données,
  • relier nos principales ressources de recherche et de formation en matière de données (le datacentre, le mésocentre, les GIFT sur les big data, et les atouts spécifiques des facultés et unités de recherche d’AMU).

Objectifs

  • Soutenir ou donner les moyens d’agir selon vos besoins en matière de volumes et de traitements spécifiques des données ;
  • Former à de bonnes pratiques en traitement informatique, solution de stockage, analyse en mobilisant les solutions AMU (mesocentre, datacenter, recherche de solutions personnalisées...) ;
  • Renforcer les liens interdisciplinaires sont les principales missions de ce nouveau programme.

Contacts

Pour toute information additionnelle, n’hésitez pas à prendre contact : amidex-cedre-contact(@)univ-amu.fr.

Membres de l’équipe opérationnelle de CEDRE :

  • Jérôme Boukaïa, Chef de Projet CEDRE, jerome-david.BOUKAIA@univ-amu.f

Ma boite à outils

Gestion des données de la recherche : quelques pistes pour démarrer, comprendre et se former

Correspondants IST-SHS est un site collaboratif alimenté par les correspondants Information Scientifique et Technique (IST) de l’InSHS. Il s’adresse à toutes personnes intéressées par les problématiques de l’IST. Vous y trouverez une très bonne série de 8 « épisodes » sur les données de la recherche, pistes de travail pour découvrir, comprendre et se former sur les données de la recherche.  La gestion de ces données de la recherche est une question centrale pour tous les professionnels de l’IST travaillant dans le monde de la recherche. Les questions posées sont d’abord, quest-ce que cest concrètement que gérer les données de la recherche, comment en tant que professionnels de lIST participer à cette gestion des données et donc aussi quelles sont les compétences à avoir et comment les acquérir.

Les 3 niveaux de sauvegarde des données de la recherche

Cette fiche proposée par DORANum vous aide à :

  • Connaître les trois étapes de sauvegarde des données
  • Comprendre la différence entre stockage sécurisé, sauvegarde pour le partage et archivage à long terme ;
  • Connaître les étapes pour mettre en pratique ces 3 niveaux de sauvegardes.

↪ Le stockage sécurisé, la sauvegarde pour le partage et l’archivage pérenne interviennent à différentes étapes du cycle de vie des données, et ont des fonctions distinctes.

Les principaux formats ouverts

Une part importante de la problématique de l’archivage pérenne c’est-à-dire sur le long terme (supérieur à 10 ans) repose sur les formats de fichiers et leur capacité à être interprétés dans le futur ainsi que sur les supports utilisés.

Documents

  • Texte brut : ASCII (.txt) / sans extension
  • Texte formaté : TeX (.tex), AbiWord (.abw), OpenDocument Text (.odt), Hypertext Markup Language (.htm ou .html), XHTML (.xhtml), Feuilles de style en cascade (.css)
  • Texte modulaire et structuré : DITA (.dita)
  • Tableur : OpenDocument Spreadsheet (.ods)
  • Enregistrements biomédicaux : European Data Format (.edf)
  • Document imprimable : Document PDF (.pdf), DjVu (.djvu)
  • Livre numérique : EPUB (.epub)

Données

  • Données brutes : CSV (.csv) / sans extension, JSON (.json), XML (.xml)
  • Données sémantiques : RDF (.rdf)
  • Données géographiques : KML (.kml), SHP (.shp)

Images

  • Image simple : PNG (.png), APNG (.png), Portable pixmap (.pbm, .pbm, .pgm, .pnm), MNG (.mng), Windows bitmap (.bmp), PGF (.pgf), WebP (.webp), GIF10 (.gif), Digital Negative (.dng)
  • Fichier graphique : OpenDocument Drawing (.odg), SVG (.svg), XCF (.xcf)

3D

  • OBJ
  • X3D
  • Le format de conteneur pour le logiciel Blender (.blend).
  • Le Collada, norme de format définit par le Kronos Group.
  • Alembic [archive], framework pour l’échange de données 3D.

DAO / CAO

  • Drawing eXchange Format (.dxf)

Multimedia

  • Vidéo : Xvid, Theora (.ogg .ogv), Dirac, VP8, VP9, AV1
  • Audio : Ogg Vorbis (.ogg .oga), FLAC (.flac), Speex (.spx), Opus (.opus), MP3 (.mp3)
  • Conteneur : Matroska (.mkv .mka .mks), Ogg (.ogg .ogv .oga .ogx), WebM (.webm .weba)

Données compressées

  • ZIP, RAR, GZ

Code source

  • Script, Java, C, C++

Documenter ses données, c’est donner les informations nécessaires pour les trouver, les lire, les comprendre et les réutiliser : sources, modalités de production, de collecte et de traitement, logiciel utilisé, format du fichier, unités de mesure, attribution de mots-clés thématiques descriptifs, localisation géographique, date d’acquisition, identifiant… Ces informations sont aussi appelées métadonnées (données décrivant des données).

Les entrepôts de données proposent une liste de métadonnées pour décrire les jeux de données qu’ils hébergent. Si certaines sont obligatoires, vous pouvez en ajouter d’autres dans des fichiers joints à vos données (source).


Pourquoi décrire ses données avec des métadonnées ?

Les métadonnées servent à définir ou décrire une donnée, quel que soit son support (papier ou électronique).
Quelques exemples de métadonnées : titre, auteur, résumé, mots-clés, identifiant, format... 
Les standards de métadonnées aide à décrire les données et sont des modèles qui précisent toutes les métadonnées nécessaires pour décrire une ressource. Il existe deux types de standards :

  • Les standards généralistes, souvent insuffisants pour décrire finement les données scientifiques mais utiles pour commencer.

  • Les standards disciplinaires, plus adaptés à vos besoins car spécialisé dans une discipline. Vous les trouverez dans des répertoires tels FAIRSharing ou RDA Metadata Directory (voir infra).

Objectifs

  • Rendre vos données visibles
    • plus la description des données est riche et précise, plus les données décrites ont de chances d’être visibles
  • Rendre vos données trouvables
    • par les moteurs de recherche notamment
  • Rendre vos données réutilisables
    • en facilitant la compréhension des jeux de données (structure, mode de recueil, contexte de création, utilisation...)

DCC (Digital Curation Centre)

Le centre de conservation numérique est reconnu dans le domaine de la conservation numérique et axé sur le renforcement des capacités et des compétences en matière de gestion des données de recherche. Il fournit des conseils d’experts et une aide pratique aux organisations de recherche qui souhaitent stocker, gérer, protéger et partager des données de recherche numériques.


FAIRsharing

Portail Web donnant accès à trois répertoires interconnectés (normes et standards dans tous les domaines, bases de données et politiques sur les données).

  • Catalogue de bases de données, décrites selon les directives BioDBcore, ainsi que les standards utilisés dans ces bases de données.
  • Normes et standards provenant de différentes sources, dont BioPortal, MIBBI et Equator Network. 
  • Catalogue de politiques de préservation, de gestion et de partage des données émanant d’organismes de financement internationaux, de sociétés et de revues scientifiques.

FAIRsharing propose également des collections qui regroupent un ou plusieurs types de ressources (standard, base de données ou politique) par domaine, projet ou organisation. https://fairsharing.org/


RDA Alliance métadonnées / RDA Metadata Directory

Le groupe de travail sur le répertoire des normes de métadonnées de la RDA est soutenu par des personnes et des organisations impliquées dans le développement, la mise en œuvre et l’utilisation de métadonnées pour des données scientifiques. L’objectif est de mettre en place un répertoire ouvert et collaboratif de normes de métadonnées applicables aux données scientifiques.
http://rd-alliance.github.io/metadata-directory/


5 règles de nommage des documents

1) Un nom bref et explicite
Le nom d’un fichier doit être le plus court possible et doit refléter son contenu. Il peut contenir son sujet, sa date, sa version (si le document est destiné à évoluer). Il est inutile d’écrire des mots vides comme : “le”, “un”, “des”, ”et”, etc.
Pour réduire le nombre de caractères, utilisez des abréviations facilement reconnaissables (CR pour compte rendu par exemple).

2) Pas d’espace ni de caractères spéciaux
Il vaut mieux ne pas mettre d’espace entre les mots ni de caractères spéciaux. Pour séparer les mots, vous pouvez mettre une majuscule ou un underscore “_”. Cette règle permet d’éviter des problèmes d’affichage voire d’accès aux documents.
Il vaut mieux donc bannir tout ce qui n’est pas alphanumérique : & / + > : ? % ( ] etc.

3) Des dates et nombres au bon format
Les dates doivent s’écrire au format AAAAMMJJ (année, mois, jour).
De même, les nombres entre 1 et 9 doivent s’écrivent avec le zéro en premier : 01, 02, 03, etc.
Pourquoi ? Car les ordinateurs rangent les documents dans l’ordre numérique, en tenant compte du premier chiffre qu’ils trouvent. Ainsi, pour maintenir un ordre numérique, il faut prendre en compte le zéro.
De même concernant les dates, commencer par l’année permet de maintenir les documents dans un ordre chronologique.

4) Des éléments dans le bon ordre
Il est préférable de bien choisir l’ordre des éléments dans le nom des fichiers. Mettez en premier l’élément qui vous est le plus pertinent pour pouvoir retrouver facilement votre document.

5) Des versions de document
Certains documents peuvent être amenés à évoluer, à avoir plusieurs versions avant une version finale, définitive. Dans ces cas là, il faut préciser la version dans le nom du fichier.
Pour faire simple, ne rédigez que la lettre V suivi du numéro de la version, en deux unités (cf. règle 3).
Vous pouvez également adopter une autre convention de nommage, par exemple VP pour Version Provisoire, VF pour Version Finale.

Elément

Exemples de règles

Exemples de nommage

Date

Date de création/modification du document, de l’événement
Format à l’américaine : AAAAMMJJ

20150108
2015_01_03

Type de document

Qualifie la nature du document.
Utilisation préconisée d’abréviations clairement définies pour être accessibles à tous les agents. Toute abréviation sera en lettres majuscules.

PO (protocole)
CR (compte-rendu)
RA (rapport d’activités)

Titre ou sujet

Il s’agit du sujet principal traité au sein du document. Utiliser des noms communs, écrits en lettres minuscules.

Commission
analyse01
colloque

Version du document

Distingue les différentes versions d’un document. Peut être signalée par un « V » en majuscule suivi de 2 chiffres, VP version provisoire, VF version finale.

_VP1
_VF
On peut aussi utiliser les initiales de l’auteur puis des « relecteurs » jusqu’à la version finale.

Exemple

Classement chronologique par sujet :
date_type_titre_signataire_version

20150108_CR_commission_DT_VP1.doc

Consulter la fiche sur le site DoRANum

Une autre ressource de l’UQAM - Université du Québec à Montréal.

 

Voici une infographie réalisée par Kira Höffler, pour l’organisation des dossiers et le nommage des fichiers.

Les fonctions essentielles d’un entrepôt de données
  • Attribuer un identifiant unique et pérenne à vos données (DOI) et rendre vos données citables
  • Offrir une description de vos données (métadonnées) d’une qualité suffisante pour que d’autres chercheurs puissent les trouver et les réutiliser
  • Gérer les accès à vos données selon vos besoins : délai d’embargo, possibilité d’accès restreint…
  • Permettre l’attribution d’une licence appropriée à vos données (ex. Creative commons)
  • Offrir des garanties de pérennité (certificat, institution en charge de l’entrepôt…)

Trouver un entrepôt disciplinaire
re3data.org : registre mondial de entrepôts de données de recherche appartenant à diverses disciplines universitaires. Il permet de rechercher parmi 1500 entrepôts de données, en fonction des types de fichiers à déposer, des disciplines concernées et des politiques de dépôt et de consultation.

Service DataCite recommandé dans les lignes directrices de la Commission européenne sur le libre accès aux publications scientifiques et aux données de recherche dans Horizon 2020.

OAD : Data repositories : wiki mis en place par l’École de Sciences de l’Information et des Bibliothèques du Simmons College à Boston. Il répertorie une centaine d’entrepôts classés par domaine disciplinaire.
NIH Data Sharing Repositories : liste du National Institute of Health (Etats-Unis) qui conseille soixante-quatre entrepôts en sciences biomédicales. Chaque entrée est accompagnée d’une description de l’entrepôt et de liens vers leur politique d’acceptation de jeux de données ainsi que d’accès aux jeux de données hébergés.

OpenDOAR : répertoire dentrepôts darchives ouvertes, OpenDOAR propose un annuaire mondial des dépôts. La recherche et la navigation peuvent s’effectuer sur différents critères tels que le nom, la région du monde ou le pays et le logiciel.

Data repositories : liste d’entrepôts et de bases de données pour les données ouvertes, qui fait partie de l’Open Access Directory (DOAJ).


Déposer dans un entrepôt généraliste / pluridisciplinaire

Vous pouvez choisir  un entrepôt de données  généraliste qui vous permet de déposer n’importe quel type de fichiers, sans limitation de taille.

Zenodo : créé par le CERN grâce au programme-cadre européen pour la recherche et le développement Horizon 2020. Il a pour objectif le partage des résultats de la recherche (publications et données de recherche) pour lesquels on ne dispose pas de dépôts institutionnels, disciplinaires ou thématiques. Zenodo permet le dépôt et le partage des produits de la recherche dans une grande variété de formats (texte, feuilles de calcul, audio, vidéo, images) dans tous les domaines de la science. Un identifiant pérenne (Digital Object Identifier, DOI) est attribué.

Figshare : entrepôt où les chercheurs peuvent conserver et partager leurs résultats de recherche (chiffres, jeux de données, images et vidéos). Les utilisateurs peuvent rendre tous les résultats de leurs recherches disponibles, citables, partageables et ouverts.


SHS : déposer, documenter et diffuser les données de la recherche avec NAKALA

Par HUMA-NUM, NAKALA est un service pour l’exposition de donnée en SHS qui permet à des équipes de recherche de déposer leurs données numériques (fichiers texte, son, image, vidéo) dans un entrepôt sécurisé qui assure à la fois l’accessibilité aux données et leur citabilité dans le temps.


Déposer vos données avec une publication dans HAL ou ArXiv

Si vos données ont pour fonction principale de soutenir une publication (et qu’elles ne sont gourmandes en espace), vous pouvez les déposer avec votre publication. Citons deux archives ouvertes :

  • Sur HAL (HAL AMU pour la production scientifique d’AMU) vous pouvez déposer vos jeux de données puis vous les liez à votre publication. Il vous suffit de créer deux dépôts (un pour la publication, un pour le jeu de données) et de faire le lien entre eux.
  • ArXiv permet d’ajouter des fichiers annexes (complementary files) à une publication et de les décrire sommairement. Pour rappel, ArXiv est une archive de prépublications électroniques d’articles scientifiques dans les domaines de la physique, l’astrophysique, des mathématiques, de l’informatique, des sciences non linéaires et de la biologie quantitative.

Navigae : un entrepôt pour les géographes
Plateforme de recherche qui valorise la dimension spatiale des données et permet de consulter des données issues de travaux en géographie. Elle a pour but de rendre accessibles, consultables et réutilisables des données cartographiques et photographiques provenant de fonds de laboratoires de recherche ou de bibliothèques.
Navigae permet de visualiser des données numériques selon des modes d’interrogation et de visualisation cartographique.
La plateforme effectue la récupération de données patrimoniales et scientifiques ayant une composante spatiale, selon les spécificités des protocoles OAI-PMH, SPARQL pour récupérer les données formalisées en triplets RDF, et selon l’architecture API REST. Renseignements : contact@navigae.fr


Critères et caractéristiques à considérer lors du choix d’un dépôt de données

Sur cette page, vous trouverez un tableau qui compare 4 entrepôts généralistes : Zenodo, Figshare, Harvard Dataverse et Dryad.

ATTENTION : vérifiez toujours

  • la pérennité d’un entrepôt avant de le choisir pour archiver vos données ;
  • la certification de l’entrepôt ;
  • où est-il hébergé ? par quelle institution ?
  • les modalités d’accès ;
  • si l’entrepôt est public ou privé, si des frais sont à prévoir...
L’exemple de Zenodo

 

→ Service du CERN (European Organization for Nuclear Research) issu d’une collaboration avec OpenAire (Open Access Infrastructure for Research in Europe) et financé par la Commission Européenne (qui recommande son utilisation).

A pour objectif le partage des résultats de la recherche (publications et données de recherche) pour lesquels on ne dispose pas de dépôts institutionnels, disciplinaires ou thématiques.

Permet le dépôt et le partage des produits de la recherche dans une grande variété de formats (texte, feuilles de calcul, audio, vidéo, images) dans tous les domaines de la science.

Attribue un identifiant pérenne (Digital Object Identifier, DOI) lors du dépôt.


L’Inist-CNRS a mis à jour une ressource sur le site DoRANum : Déposer ses données de recherche dans Zenodo.


Lien vers l’entrepôt : zenodo.org/

 


L’exemple de Nakala

➙ Entrepôt de données de recherche en SHS, base de données destinée à accueillir, conserver, rendre visibles et accessibles les données de recherche.

Service d’Huma-Num qui permet à des chercheurs, enseignants-chercheurs ou équipes de recherche de partager, publier et valoriser tous types de données numériques documentées (fichiers textes, sons, images, vidéos, objets 3D, etc.) dans un entrepôt sécurisé afin de les publier en accord avec les principes du FAIR data (Facile à trouver, Accessible, Interopérable et Réutilisable).

Lire la documentation.

En résumé, NAKALA

  • vous décharge de la gestion de vos données ;
  • vous permet de les visualiser ;
  • vous permet de les regrouper et les présenter dans des collections homogènes ;
  • prend en charge le partage interopérable des données et des métadonnées et leur citabilité ;
  • dissocie le stockage de données de leur présentation ;
  • prépare le référencement des données dans ISIDORE et facilite le processus d’archivage à long terme ;
  • permet l’éditorialisation de vos données dans un site web personnalisé de type https://monprojet.nakala.fr grâce au module de publication NAKALA_Press.

Utiliser NAKALA

L’accès à NAKALA pour déposer et gérer des données nécessite de faire une demande d’accès sur le portail HumanID

Liens

Une fois connecté sur le portail HumanID, vous pouvez demander l’accès à NAKALA.


Lien vers l’entrepôt : https://www.nakala.fr/

Identifiants pérennes  

Les identifiants pérennes sont des éléments importants du mouvement de l’Open Science. Il en existe 2 grands types : les identifiants objet pour vos productions scientifiques (publications et données) et les identifiants contributeur pour les auteurs et les institutions. On parle souvent de PID pour Persistent IDentifier en anglais.

Consulter la fiche synthétique de DORANum.

↪ Plusieurs systèmes d’identifications collaborent pour offrir des services permettant d’agréger les productions scientifiques, c’est-à-dire les publications et les données, à leur(s) auteur(s) et leur(s) institution(s).
Ex : Auto-Update Service = DOI (Crossref → publications) + DOI (DataCite → données) + ORCID (collaborateurs).


Digital object identifier

↪ « Identifiant numérique d’objet » : mécanisme d’identification de ressources (numériques - film, rapport, articles scientifiques) et de personnes ou tout autre type d’objets. Le DOI facilite la gestion numérique sur le long terme de toute chose en associant des métadonnées à l’identifiant de la chose à gérer. Les métadonnées peuvent évoluer au cours du temps, mais l’identifiant reste invariant.


Quelques services

 

DataCite

Consortium international de bibliothèques et services spécialisés dans les sciences de l'information qui vise à faciliter l’archivage numérique ainsi que l’accès aux ressources numériques sur Internet, notamment par l’attribution d’un DOI à chacune d’entre elles.

  • Premier fournisseur mondial d’identifiants pérennes pour les données de recherche et autres résultats de recherche.

DataCite offre les moyens de créer, rechercher, citer, connecter et utiliser la recherche et développe des services supplémentaires pour améliorer l'expérience de gestion des DOI. https://datacite.org/index.html

 
DOI Citation Formatter

Service créé en collaboration avec Crossref, mEDRA, ISTIC et JaLC. Il fournit une interface simple pour extraire automatiquement les métadonnées d’un DOI et créer une citation complète. Il prend en charge plus de 5 000 styles de citations différents dans 45 langues différentes, en utilisant le langage de style de citation. https://citation.crosscite.org/

 
DataCite via OPIDoR

Une équipe dédiée au sein de l’Inist-CNRS se tient à votre disposition pour vous conseiller au plus près de vos recherches dans l’attribution de DOI à vos données (fourniture des préfixes DOI, assistance à la création et à la conversion de métadonnées…) et également vous accompagner dans l’utilisation des différents services proposés par DataCite. https://opidor.fr/identifier/

Juin 2019 : lancement de Pid Opidor application destinée aux organismes de recherche disposant d’un compte auprès d’un membre DataCite et souhaitant gérer et attribuer en masse des DOI de façon « user friendly ». Outre la création de DOI en masse, ce service permet la mise à jour des métadonnées ou des URL d’accès aux données pour les DOI déjà enregistrés, ainsi que la vérification de ces URL à l’enregistrement ou à la demande.
www.inist.fr/realisations/pid-opidor/

 
DataCite Profiles

Fournit des outils à usage personnel d’intégration avec ORCID. Les chercheurs peuvent connecter leurs profils et mettre à jour automatiquement leur enregistrement ORCID lorsque l’une de leurs œuvres contient un DOI.
https://profiles.datacite.org/

 

DataCite Search

Pour présenter et afficher les métadonnées collectées, DataCite fournit une interface de recherche intégrée dans laquelle il est possible de rechercher, filtrer et extraire tous les détails. https://search.datacite.org/

Qu’est-ce que le data paper ?

Il existe plusieurs moyens pour publier ses données. Parmi eux, les data papers ont l’avantage d’être des articles à part entière, suivant la même logique de processus éditorial que les articles scientifiques classiques.

Un data paper est un article sur les données de recherche qui permet de décrire les données produites (brutes) au cours d’un processus de recherche (méthodologie, process, matériel utilisé, lien vers l’entrepôt où se trouve les données, etc.). Il est revu par les pairs et peut être publié soit dans une revue traditionnelle soit dans une revue dédiée que l’on appelle « data journal ». 

Le data paper est citable au même titre qu’une publication classique. Il met en valeur ses auteurs en tant que créateurs de données et permet la traçabilité des citations et de la réutilisation des données.

Il ne rend pas compte des hypothèses ni des conclusions issues de l’analyse de ces données mais le data paper :

  • décrit un jeu de données de recherche (dataset), notamment à l’aide des métadonnées (metadata), qui détaillent pourquoi, par qui et comment ces données ont été collectées, qui en est propriétaire, sous quel format elles sont stockées, etc.
  • démontre la qualité des données et de leur méthode de collecte et de traitement.
  • montre l’originalité et la portée de ce jeu de données, ainsi que leur potentiel de réutilisation (arguments décisifs pour l’acceptation de la publication).
  • donne généralement accès au jeu de données, à l’entrepôt où le jeu est déposé.

Pourquoi publier un data paper ?
  • pour valoriser les données ;
  • pour faciliter leur réutilisation ;
  • pour leur apporter plus de visibilité ;
  • pour les rendre plus facilement repérables et citables.

Comment structurer un data paper ?

strucutre d'un data paper

Open Science : gestion et partage des données de la recherche / Esther Dzale & Dominique l'Hostis (source)


Où publier un data paper ?

Quelques exemples
  • Biodiversity Data Journal - édité par Pensoft (Télécharger un exemple) ;
  • Scientific Data - édité par Nature Publishing Group (Télécharger un exemple) ;
  • Gigascience est une revue dédiée aux études sur les « Big Data » en sciences de la vie adossée à une base de données (GigaDB) permettant l'hébergement des jeux de données - édité par BioMedCentral (Télécharger un exemple) ;
  • Journal of Open Archaelogy Data - édité par Ubiquity Press (Télécharger un exemple) ;
  • Cybergeo dispose d’une rubrique sur les données ouvertes qui contient des data papers évalués par les pairs. (Consulter les articles).
  • Journal of Open Archaeology Data - JOAD - publie des articles de données qui ne contiennent pas de résultats de recherche mais une description concise d'un ensemble de données et où les trouver. Les articles ne seront acceptés que pour les ensembles de données que les auteurs acceptent de mettre gratuitement à disposition dans un référentiel public. Cela signifie qu'elles ont été déposées dans un référentiel de données sous une licence ouverte (telle qu'une licence Creative Commons Zero). Lien vers le site.
  • Journal of Open Humanities Data - JOHD - publie des data papers ainsi que des articles de recherche qui traitent des défis du travail sur les données en SHS. Le JOHD s’engage aussi à structurer la communauté scientifique, surtout en SHS, autour des principes de la recherche ouverte. Présente des publications évaluées par des pairs décrivant des objets ou des techniques de recherche en Sciences Humaines à fort potentiel de réutilisation. Lien vers le site.

Lectures

Ouverture des données de recherche. Guide d’analyse du cadre juridique en France

Ce guide sur l’ouverture des données de recherche (ou Open Data) a pour vocation d’accompagner les agents des établissements concernés (établissements d’enseignement et organismes de recherche) dans une démarche d’ouverture raisonnée des données de recherche en tentant de répondre aux questions les plus courantes auxquelles ils pourront être confrontés, que cette démarche soit volontaire et réponde aux objectifs de l’établissement ou qu’elle soit imposée par la réglementation. Il est précisé que le cadre légal est cité, lorsqu’il existe. L’attention du lecteur est toutefois attirée sur le paysage très mouvant du droit sur ce sujet et sur la nécessité de se référer à la politique de son établissement en matière d’Open Data..... Lire le guide.


Aide à la décision sur la diffusion des données de recherche

Passez en revue vos données en répondant aux questions successives de l’arbre de situation du Cirad « Aide à la décision sur la diffusion des données de recherche ». (source : Avez-vous le droit ou l'obligation de diffuser vos données ?)

Le dispositif en ligne proposé vise à :

  • aider à la prise de décision pour ouvrir les données dans le cadre d’activités ou de projets de recherche ;
  • informer sur les lois et réglementations en vigueur, notamment en France et en Europe autour des données et de leur diffusion ;
  • sensibiliser aux bonnes pratiques de diffusion de données de recherche ;
  • anticiper les situations et les choix possibles d’ouverture de données dans de nouveaux contextes.

Un logigramme pour saisir le contexte juridique définissant le partage de vos données de la recherche

Le Pôle IST de l’École des Ponts ParisTech propose un outil d’aide à la décision en matière de partage des données de la recherche. Il se trouve sous la forme d’un logigramme à plat ou d’un logigramme dynamique. Pour une information exhaustive vous pouvez également consulter l’analyse synthétique du cadre juridique concernant les données de la recherche.

Les durées de conservation des données

source : https://www.cnil.fr/fr/les-durees-de-conservation-des-donnees

Les données personnelles ne peuvent être conservées indéfiniment : une durée de conservation doit être déterminée par le responsable de traitement en fonction de l’objectif ayant conduit à la collecte de ces données. Ce principe de conservation limitée des données personnelles est prévu par le RGPD et la loi Informatique et Libertés.

La CNIL a  élaboré des outils d’aide à l’identification des durées applicables à la conservation des données, ainsi qu’un guide pour faciliter la mise en œuvre de ce principe. Ces outils sont destinés à tout professionnel, quel que soit son secteur (public ou privé) et quelle que soit la taille de sa structure.

Consultez les différentes ressources mises à votre disposition par la CNIL

↪ Le guide pratique sur les durées de conservation : répond aux questions que se posent fréquemment les professionnels, tant sur le principe de la limitation de la conservation des durées que sur sa mise en pratique. Il présente également l’outil « référentiel durées de conservation », du point de vue contenu et utilisation.

Élaboré en partenariat avec le service interministériel des archives de France (SIAF), ce guide pratique explicite comment  articuler les obligations du RGPD et celles imposées par le Code du patrimoine.

3 référentiels de durées de conservation pour la santé : destiné à aider les responsables de traitement concernés dans la gestion des traitements courants des cabinets médicaux et paramédicaux et dans le choix de durées de conservation.

Comités de protection des personnes (CPP)

Les CPP sont chargés d’émettre un avis préalable sur les conditions de validité de toute recherche impliquant la personne humaine, au regard des critères définis par l’article L 1123-7 du Code de la Santé Publique (CSP).

Les termes de « recherche impliquant la personne humaine » désignent tout essai ou expérimentation organisé et pratiqué sur l’être humain, en vue du développement des connaissances biologiques ou médicales.


Loi Jardé et son application en pratique

La publication de la loi relative aux recherches impliquant la personne humaine, communément nommée Loi Jardé, a eu pour conséquence de nouvelles procédures de soumissions réglementaires. En savoir plus.

L’université de Strasbourg propose un outil qui, en quelques questions, vous permet de connaître les démarches à accomplir en regard de la loi sur la recherche impliquant la personne humaine (Loi Jardé), du règlement général de la protection des données et de la loi informatiques et libertés.

Pour savoir si vous devez constituer un dossier pour le CPP, nous vous encourageons à compléter en amont de votre travail le questionnaire : Formalités réglementaires 2020 en recherche en santé.


Quelques liens utiles

  • Vos données de la recherche sont diffusables et vous vous demandez quelle licence leur attribuer ?
  • Vous souhaitez réutiliser à titre gratuit des informations publiques comme des données, logiciels, bases de données et vous ne savez pas comment faire.

L’animation interactive est là pour vous aider !

Source : https://doranum.fr/aspects-juridiques-ethiques/les-licences-de-reutilisation-dans-le-cadre-de-lopen-data-2/


Outil Creative Commons

Utilisez l’outils Creative Commons « Share your work » pour partager votre travail.


Rendre publics ses jeux de données scientifiques

Lisez les chapitres 5 et 6 du site coop IST du Cirad > extrait de Dedieu L. ; Fily M.F. 2015. Rendre publics ses jeux de données scientifiques, en 6 points. Montpellier (FRA) : CIRAD, 6 p. https://doi.org/10.18167/coopist/0059


Comment choisir une licence ?
Un lien intéressant pour en savoir plus sur le choix des licences : https://www6.inra.fr/datapartage/Partager-Publier/Choisir-une-licence

OPIDoR : outils et services pour optimiser le partage et l’interopérabilité des données de la recherche

Le portail OPIDoR met à disposition de la communauté de l’enseignement supérieur et de la recherche un ensemble d’outils et de services facilitant la gestion et la valorisation des données afin de répondre aux critères d’intégrité, de reproductibilité et aux principes FAIR qui visent à rendre les données Faciles à trouver, Accessibles, Interopérables, Réutilisables.


Grille de relecture de plans de gestion de données – Modèle ANR

Tutoriel sur l’outil de rédaction DMP OPIDoR


DoRANum

Données de la Recherche : Apprentissage Numérique (DoRANum) est une plateforme de formation portée par l’Inist-CNRS et le GIS réseau des Urfist.

DoRANum propose un dispositif de formation à distance d’accès coordonné, intégrant différentes ressources d’auto-formation sur la thématique de la gestion et du partage des données de la recherche. Existantes ou créées dans le cadre du projet, ces ressources proposent plusieurs parcours et modes d’apprentissage.

La diversité des ressources et la complémentarité des modes et parcours permettent de répondre aux attentes et usages des publics visés : chercheurs, enseignants-chercheurs, doctorants et professionnels de l’information des établissements d’enseignement supérieur et de recherche.

Lien vers le site : https://doranum.fr/