Aller au contenu principal

Annexes

Annexe A : Principes de partage de données FAIRS(S)

Principes FAIR, tels que décrits dans https://www.go-fair.org/fair-principles/.

Trouvable

La première étape pour (ré)utiliser les données est de les retrouver. Les métadonnées et les données doivent être faciles à trouver tant pour les humains que pour les ordinateurs. Les métadonnées lisibles par machine sont essentielles à la découverte automatique des ensembles de données et des services. Il s'agit donc d'un élément essentiel du processus de FAIRification.

F1. Les (méta)données se voient attribuer un identifiant unique et persistant au monde.

F2. Les données sont décrites avec des métadonnées riches (définies par R1 ci-dessous)

F3. Les métadonnées incluent clairement et explicitement l'identifiant des données qu'elles décrivent

F4. Les (méta)données sont enregistrées ou indexées dans une ressource consultable

Accessible

Une fois que l'utilisateur a trouvé les données requises, il doit savoir comment y accéder, y compris éventuellement authentification et autorisation.

A1. Les (méta)données sont récupérables par leur identifiant à l'aide d'un protocole de communication standardisé

A1.1 Le protocole est ouvert, gratuit et universellement mis en œuvre

A1.2 Le protocole permet une procédure d'authentification et d'autorisation, si nécessaire

A2. Les métadonnées sont accessibles, même lorsque les données ne sont plus disponibles

Interopérable

Les données doivent généralement être intégrées à d’autres données. De plus, les données doivent interagir avec des applications ou des flux de travail pour l'analyse, le stockage et le traitement.

I1. Les (méta)données utilisent un langage formel, accessible, partagé et largement applicable pour la représentation des connaissances.

I2. Les (méta)données utilisent des vocabulaires qui suivent les principes FAIR

I3. Les (méta)données incluent des références qualifiées à d’autres (méta)données

Réutilisable

L’objectif ultime de FAIR est d’optimiser la réutilisation des données. Pour y parvenir, les métadonnées et les données doivent être bien décrites afin qu'elles puissent être répliquées et/ou combinées dans différents contextes.

R1. Les (méta)données sont richement décrites avec une pluralité d'attributs précis et pertinents

R1.1. Les (méta)données sont publiées avec une licence d'utilisation des données claire et accessible

R1.2. Les (méta)données sont associées à une provenance détaillée

R1.3. Les (méta)données répondent aux normes communautaires pertinentes pour le domaine

Annexe B : Principes de partage de données de CARE

Les principes CARE sont fondés sur « les personnes et les objectifs », tandis que les principes FAIR sont « axés sur les données ». Cela signifie que les principes de CARE comblent les lacunes des principes FAIR en termes de droits et d’intérêts des peuples autochtones et de leur vision du monde.

Les principes CARE de GIDA sont les suivants (réf) :

Prestation collective

Les écosystèmes de données doivent être conçus et fonctionner de manière à permettre aux peuples autochtones de tirer profit des données.

C1 : Pour un développement et une innovation inclusifs

Les gouvernements et les institutions doivent soutenir activement l'utilisation et la réutilisation des données par les Autochtones. nations et communautés en facilitant l’établissement des fondations pour les peuples autochtones l’innovation, la génération de valeur et la promotion de processus de développement locaux autodéterminés.

C2 : Pour une meilleure gouvernance et un engagement citoyen

Les données enrichissent les processus de planification, de mise en œuvre et d'évaluation qui soutiennent le service et besoins politiques des communautés autochtones. Les données permettent également un meilleur engagement entre les citoyens, institutions et gouvernements pour améliorer la prise de décision. L'utilisation éthique des données ouvertes a le capacité d’améliorer la transparence et la prise de décision en fournissant aux nations autochtones et communautés avec une meilleure compréhension de leurs peuples, territoires et ressources. Il de la même manière, il peut fournir un meilleur aperçu des politiques et programmes tiers affectant Populations indigènes.

C3 : Pour une meilleure gouvernance et un engagement citoyen

Les données autochtones sont fondées sur les valeurs communautaires, qui s’étendent à la société dans son ensemble. De n'importe quelle valeur créés à partir de données autochtones devraient profiter aux communautés autochtones de manière équitable et contribuer aux aspirations autochtones en matière de bien-être.

Autorité de contrôle

Les droits et intérêts des peuples autochtones dans les données autochtones doivent être reconnus et leur autorité pour contrôler ces données doit être renforcée. La gouvernance des données autochtones permet aux peuples autochtones et aux organes directeurs de déterminer comment les peuples autochtones, ainsi que les terres, territoires, ressources, connaissances et indicateurs géographiques autochtones, sont représentés et identifiés dans les données.

A1 : Reconnaître les droits et les intérêts

Les peuples autochtones ont des droits et des intérêts à la fois sur les connaissances autochtones et sur les données autochtones. Les peuples autochtones ont des droits collectifs et individuels au consentement libre, préalable et éclairé dans la collecte et l'utilisation de ces données, y compris l'élaboration de politiques et de protocoles en matière de données pour la collecte.

A2 : Données pour la gouvernance

Les peuples autochtones ont droit à des données pertinentes par rapport à leur vision du monde et à leur autonomisation. l’autodétermination et une gouvernance autonome efficace. Les données autochtones doivent être mises à disposition et accessibles aux nations et aux communautés autochtones afin de soutenir la gouvernance autochtone.

A3 : Gouvernance des données

Les peuples autochtones ont le droit d’élaborer des protocoles de gouvernance culturelle pour les données autochtones et être des leaders actifs dans la gestion et l’accès aux données autochtones, en particulier dans le contexte du savoir autochtone.

Responsabilité

Ceux qui travaillent avec des données autochtones ont la responsabilité de partager la manière dont les données sont utilisées pour soutenir l’autodétermination et le bénéfice collectif des peuples autochtones.

R1 : Pour des relations positives

L’utilisation des données autochtones n’est viable que si elle est liée à des relations fondées sur le respect, la réciprocité, la confiance et la compréhension mutuelle, telles que définies par les peuples autochtones auxquels ces données sont destinées. se rapporter. Ceux qui travaillent avec des données autochtones ont la responsabilité de veiller à ce que la création, l’interprétation et l’utilisation de ces données soutiennent ou respectent la dignité des peuples autochtones. nations et communautés.

R2 : Pour étendre les capacités et les capacités

L’utilisation des données autochtones implique une responsabilité réciproque d’améliorer la maîtrise des données au sein de communautés autochtones et pour soutenir le développement d’une main-d’œuvre autochtone en matière de données et infrastructure numérique pour permettre la création, la collecte, la gestion, la sécurité, la gouvernance, et l'application des données.

R3 : Pour les langues et visions du monde autochtones

Des ressources doivent être fournies pour générer des données fondées sur les langages, les visions du monde et expériences vécues (y compris les valeurs et les principes) des peuples autochtones.

Éthique

Les droits et le bien-être des peuples autochtones devraient être la principale préoccupation à toutes les étapes du cycle de vie des données et dans tout l’écosystème des données.

E1 : Pour minimiser les dommages et maximiser les avantages

Les données éthiques sont des données qui ne stigmatisent ni ne décrivent les peuples, les cultures et les peuples autochtones. ou des connaissances en termes de déficit. Les données éthiques sont collectées et utilisées de manière à s’aligner sur les cadres éthiques autochtones et sur les droits affirmés dans la DNUDPA. Évaluer les avantages et les préjudices éthiques devraient être considérés du point de vue des peuples autochtones, nations ou communautés auxquelles les données se rapportent.

E2 : Pour la justice

Les processus éthiques abordent les déséquilibres de pouvoir, de ressources et la manière dont ceux-ci affectent la société. expression des droits autochtones et des droits de la personne. Les processus éthiques doivent inclure représentation des communautés autochtones concernées.

E3 : Pour une utilisation future

La gouvernance des données doit prendre en compte l’utilisation future potentielle et les dommages futurs fondé sur des cadres éthiques fondés sur les valeurs et les principes des Communauté autochtone. Les métadonnées doivent reconnaître la provenance et le but et toute limitation ou obligation en matière d'utilisation secondaire, y compris les questions de consentement.

Annexe C : Termes des métadonnées

GBADs utilise schema.org pour les métadonnées. Une liste complète des termes de métadonnées se trouve dans le tableau 1 :

Annexe D : Modèle de métadonnées JSON

Cette section contient un modèle de métadonnées JSON, avec tous les termes de métadonnées (Tableau 1).


"@contexte": {
},
"@identifiant": "",
"@taper": "",
"URI": "",
"titre": "",
"des droits d'accès":"",
"accumulation":{
"Méthode d'accumulation": "",
"accrualPeriodicity": "",
},
"Citation bibliographique": "",
"créateur": {
"creatorCorporate": "",
"creatorPersonal": "",
},
"date de création":"",
"couverture": {
"temporalCoverage": "",
"Couverture spatiale": ""
},
"date": {
"disponible": "",
"créé": "",
"dateAcceptée": "",
"dateCopyright": "",
"Date de soumission": "",
"émis": "",
"modifié": ""
},
"IDdonnées": "",
"description": "",
"distribution": "",
"Documentation": "",
"approuvé par": "",
"relation":{
"format": "",
"hasFormat": "",
"hasPart": "",
"hasVersion": "",
"isFormatOf": "",
"fait partie de": "",
"isReplacedBy": "",
"isRequiredBy": "",
"isVersionOf": "",
"relationIsTranslationOf": "",
"relationHasTranslation": "",
"remplace": "",
"a besoin": ""
},
"sujet": {
"Classification du sujet": "",
"subjectKeywords": "",
"subjectThesaraus": ""
},
"langue":"",
"Licence":"",
"médiateur":"",
"modifié":"",
"provenance":"",
"éditeur":"",
"les références":"",
"droits":"",
"droitsTitulaire": "",
"source": "",
"méthodologie": "",
"metadataInformation": "",
"Schéma d'encodage du vocabulaire": ""

Annexe E : Contrats de licence

Nous avons dressé une liste d'accords de licence de données pour référence :

Creative Commons (CC)

CC propose 6 types de licences différents : CC-BY, CC BY-SA, CC BY-NC, CC BY-NC,SA, CC BY-ND, CC BY-NC-ND

Chaque licence telle que définie par CC :

Type CCExplication
CC PARCette licence permet aux réutilisateurs de distribuer, remixer, adapter et développer le matériel sur n'importe quel support ou format, à condition que l'attribution soit attribuée au créateur. La licence autorise une utilisation commerciale.
CC BY-SACette licence permet aux réutilisateurs de distribuer, remixer, adapter et développer le matériel sur n'importe quel support ou format, à condition que l'attribution soit attribuée au créateur. La licence autorise une utilisation commerciale. Si vous remixez, adaptez ou développez le matériel, vous devez obtenir une licence pour le matériel modifié selon des conditions identiques.
CC BY-NCCette licence permet aux réutilisateurs de distribuer, remixer, adapter et développer le matériel sur n'importe quel support ou format à des fins non commerciales uniquement, et seulement tant que l'attribution est donnée au créateur.
CC BY-NC-SACette licence permet aux réutilisateurs de distribuer, remixer, adapter et développer le matériel sur n'importe quel support ou format à des fins non commerciales uniquement, et seulement tant que l'attribution est donnée au créateur. Si vous remixez, adaptez ou développez le matériel, vous devez obtenir une licence pour le matériel modifié selon des conditions identiques.
CC BY-NDCette licence permet aux réutilisateurs de copier et de distribuer le matériel sur n'importe quel support ou format sous une forme inadaptée uniquement, et seulement tant que l'attribution est attribuée au créateur. La licence autorise une utilisation commerciale.
CC BY-NC-NDCette licence permet aux réutilisateurs de copier et de distribuer le matériel sur n'importe quel support ou format sous une forme inadaptée uniquement, à des fins non commerciales uniquement, et seulement tant que l'attribution est attribuée au créateur.

Y compris les licences susmentionnées, creative commons propose un outil de dédicace au domaine public, CC0. En cela, un créateur perd ses droits sur son œuvre et permet « aux utilisateurs de distribuer, remixer, adapter et développer le matériel sur n’importe quel support ou format, sans conditions ».

Toute personne possédant un contenu original peut utiliser les licences CC simplement en incluant le texte du droit d'auteur et les informations de licence, avec un lien vers la licence par laquelle l'œuvre est protégée.

Licences de base de données ouvertes Open Data Commons (ODbL)

L'ODbL 1.0 complet ici, et un résumé ici.

En général, elle est très similaire à la licence CC BY-SA, mais elle nécessite de « rester ouverte », ce qui signifie : « Si vous redistribuez la base de données, ou une version adaptée de celle-ci, vous pouvez alors utiliser des mesures technologiques qui restreignent l’œuvre (comme les DRM) à condition que vous redistribuiez également une version sans de telles mesures.

Licences de la FAO

Les informations sur les licences de données de la FAO sont incluses dans le document « Politique de licences de données ouvertes pour les bases de données statistiques » [référence à ajouter : Informations sur les licences de données de la FAO], qui s'appuie sur CC BY-NC-SA 3.0 IGO.

Les bases de données d'entreprise suivantes sont sous cette licence :

  • Systèmes d'information sur les marchés agricoles
  • Système Mondial d'Information sur l'Eau et l'Agriculture -FAOSTAT
  • STATUT DE POISSON
  • Base de données genre et droits fonciers
  • Outil de suivi et d'analyse des prix alimentaires
  • Consommation alimentaire individuelle mondiale
  • Portail de données ODD

Licences de la Banque mondiale

À l'instar de la FAO, la Banque mondiale est titulaire d'une licence CC (CC BY 4.0) avec des termes et conditions supplémentaires, qui peut être trouvé ici [référence à ajouter].

Licences du gouvernement ouvert

Annexe G : Normes de données

Y compris les sources de données connues, toutes les définitions, les normes de données étudiées, l'explication des normes et mécanismes techniques,
vocabulaires identifiés ou construits (probablement juste des liens vers ceux-ci car ils peuvent être volumineux), licences et site qui
expliquer plus en détail ces licences, les types d'utilisateurs et comment nous allons les identifier, les authentifier et les autoriser, métadonnées
adoptés ou développés par les GBADs.
Terme de métadonnéesNorme
dateISO 8601
langueISO 639-2
couverture spatialeTGN GeoNames
sujet, sujetClassification, sujetThesaurusAGROVOC Agroportal
méthode d'accumulationVocabulaire de type DCMI - Méthode d'accumulation
accumulationPériodicitéVocabulaire de type DCMI - Périodicité d'accumulation

Annexe H : Liste de contrôle GATHER

Élément de la liste de contrôle RASSEMBLERCommentaires et améliorations des GBAD
Objectifs et financement
1. Définir le ou les indicateurs, les populations (y compris l'âge, le sexe et les entités géographiques) et la ou les périodes pour lesquelles des estimations ont été effectuées.GBADs s’intéresse aux estimations des maladies animales et non humaines. Par conséquent, les populations indicatrices sont toujours importantes, mais elles concernent également les espèces, le type de maladie et potentiellement d’autres indicateurs tels que les modèles ou estimations économiques et les informations climatiques et météorologiques. Les définitions des entités géographiques (spatialCoverage) et des périodes de temps (temporalCoverage) restent cohérentes avec la liste de contrôle GATHER originale.
2. Énumérez les sources de financement des travaux.
Entrées de données Pour toutes les entrées de données provenant de sources multiples qui sont synthétisées dans le cadre de l'étude :
3. Décrivez comment les données ont été identifiées et comment elles ont été consultées.
4. Précisez les critères d'inclusion et d'exclusion. Identifiez toutes les exclusions ponctuelles.
5. Fournissez des informations sur toutes les sources de données incluses et leurs principales caractéristiques. Pour chaque source de données utilisée, indiquez les informations de référence ou le nom/l'institution du contact, la population représentée, la méthode de collecte de données, l'année ou les années de collecte de données, le sexe et la tranche d'âge, les critères de diagnostic ou la méthode de mesure et la taille de l'échantillon, le cas échéant.Les métadonnées GBADs auront un identifiant unique. Cela devrait fournir une méthode simple pour accéder à toutes ces informations, qui seront fournies dans les métadonnées de chaque attribut de données.

Annexe I : Audits de données

Audits et examens des données et de leur gestion

Les audits font partie intégrante de notre plan de gouvernance des données ; ils permettent à notre organisation de comprendre comment les données sont gérées, si nos besoins en données sont satisfaits et de fournir des informations sur nos banques de données actuelles. Pour les GBAD, les audits se font sous la forme de rapports réguliers aux bailleurs de fonds.

L'évaluation des données négociées par GBADs nous permettra de comprendre quels types de données sont riches et lesquels manquent. Dans les étapes préliminaires du développement de l'écosystème de données, cela permettra également aux auditeurs de déterminer si les métadonnées descriptives peuvent être complétées par davantage de termes et si le système prend en charge les principes directeurs FAIR et CARE. Nous prévoyons des données privées, c'est pourquoi des protocoles d'examen seront développés pour garantir que les données sont consultées comme prévu.

Des audits réguliers permettront de déterminer si le plan de gouvernance des données est clair et bien documenté ; les mécanismes derrière la localisation, le stockage, la création de métadonnées, la propriété et la gestion des données doivent être clairs et faciles à respecter si les plans et les politiques sont clairs et bien documentés. Si les audits révèlent des incohérences dans la façon dont les données sont gérées, la gestion des données peut être corrigée.

Des audits réguliers des données répondront à ces 5 questions fondamentales :

  1. Quels actifs de données existent actuellement ?
  2. Où se trouvent ces actifs ?
  3. Comment ont-ils été gérés jusqu’à présent ?
  4. Lesquels de ces actifs doivent être maintenus à long terme ?
  5. Les pratiques actuelles de gestion des données mettent-elles ces actifs en danger ?

Notre système prend en charge la confidentialité et la sécurité de nos parties prenantes en matière de données privées. Nous inclurons donc les questions supplémentaires suivantes :

  1. Qui a accès à quelles ressources de données ?
  2. Qui sont nos parties prenantes en matière de données privées et les pratiques actuelles de gestion des données protègent-elles de manière adéquate nos parties prenantes en matière de données privées ?

Cette section fournit des informations sur notre plan d'audit des données et sur la manière dont les résultats de l'audit alimenteront notre plan de gouvernance et de gestion des données. Des audits réguliers nous permettront d'améliorer progressivement la qualité des métadonnées et des données qui transitent par notre système. L'audit comprendra l'examen des commentaires des utilisateurs et des contributeurs de données afin d'incorporer formellement les suggestions dans les futures versions de notre système et d'améliorer la création et la gestion des métadonnées pour prendre en charge les données FAIR.