Datenlizenzen, Sicherheit und Datenschutz
Es gibt drei Kernfälle, in denen Datenlizenzierung, Datenschutz und Sicherheit wichtig sind:
- Sicherstellen, dass wir Daten gemäß der Lizenzvereinbarung verwenden, speichern und weitergeben und dass wir Daten ordnungsgemäß zitieren
- Sichere Speicherung privater Daten zum Schutz personenbezogener Daten
- Zuweisung einer Lizenz für alle von GBADs erstellten Ausgabedaten
Durch die Sicherstellung, dass die mit der Sicherheit und dem Zugriff auf Daten in GBADs verbundenen Prozesse eine Vertrauensgemeinschaft zwischen Datengebern und -nutzern fördern.
Hinweis zu privaten Daten:
Wir verwenden derzeit nur öffentliche Daten für Modelle in GBADs. Im Hinblick auf private Daten haben wir die Infrastruktur konzipiert und geschaffen, die die Sicherheit privater Daten unterstützt.
Arbeitsgruppe 1 sollte sich der Lizenzierung und des Datenschutzes bewusst sein, wenn sie Partnerschaften und Allianzen mit potenziellen Datenlieferanten eingeht.
Datenoffenheit in einem Spektrum
GBADs verbreiten und speichern in einigen Fällen Daten, für die verschiedene Zugriffs-, Nutzungs- und Wiederverwendungsbeschränkungen gelten. Nicht alle Daten können offen sein, und Datenschutz ist nicht so einfach wie offene oder private Daten. Um den Austausch zu fördern, ist es wichtig, dass Datenlieferanten die Möglichkeit erhalten, auszuwählen, wie ihre Daten verwendet werden sollen, wofür sie verwendet werden sollen und von wem sie verwendet werden sollen. Datenlizenzvereinbarungen stellen sicher, dass die Datennutzung nicht verwechselt wird, und informieren unser System darüber, wer Daten sehen, herunterladen oder verwenden kann.
„{Marge}“ Auch Daten, die als „Offen“ definiert sind, benötigen eine Lizenz! Wenn Sie offene Daten verwenden, müssen Sie noch bestimmen, wie der Datensatz richtig zugeordnet (oder zitiert) wird. Darüber hinaus können Daten als offen betrachtet werden, es können jedoch dennoch Einschränkungen hinsichtlich ihrer Verwendung bestehen. Beispielsweise beschränken einige Open-Data-Lizenzen die Nutzung von Daten für kommerzielle Zwecke. „
Das Open Data Institute kommuniziert diese Idee, indem es Daten in einem Spektrum von geschlossenen bis offenen Daten bereitstellt.
Kategorien im Datenspektrum
Wir haben das Spektrum genutzt, um vier separate Datenlizenzierungskategorien zu entwickeln:
Offene Daten: „Offen bedeutet, dass jeder für jeden Zweck frei darauf zugreifen, sie verwenden, ändern und teilen kann (höchstens vorbehaltlich der Anforderungen, die Herkunft und Offenheit wahren).“
Öffentlich zugängliche Daten: Die Daten sind durch eine Lizenzvereinbarung geschützt, die die Nutzung und Verbreitung der Daten und/oder der Modelle, für die die Daten verwendet werden können, einschränkt. Dazu kann gehören, wie und für welche Zwecke die Daten genutzt werden können, Zuordnungspflichten usw.
Gruppenbasierte Zugangsdaten: Für den Zugriff auf die Daten ist eine Authentifizierung erforderlich. Wie öffentlich zugängliche Daten sind auch die Daten durch eine Lizenzvereinbarung geschützt, die die Nutzung und Verbreitung der Daten und/oder der Modelle, für die die Daten verwendet werden können, einschränkt.
Benannte Zugangsdaten und interne Zugangsdaten: Zur Regelung der Nutzung, Zuordnung und Zugriffsbeschränkungen der Daten ist ein besonderer Vertrag erforderlich. Dies wird ausdrücklich durch einen Vertrag und/oder eine Geheimhaltungsvereinbarung festgelegt, was einen direkten Kontakt mit dem Rechtsteam von GBAD erfordert. Wir haben diese beiden gruppiert, da für beide ein Datenvertrag erforderlich ist und für die Nutzung ein benannter (und authentifizierter) Zugriff erforderlich ist.
Erforderliche Entscheidungen:
- Wie werden Benutzer authentifiziert?
- Wie werden Benutzergruppen authentifiziert?
- Welche Lizenz werden wir für von GBADs generierte Modelle und von den Modellen generierte Datenausgaben verwenden?
Persönlich identifizierbare Informationen (PII)
Persönlich identifizierbare Informationen (PII) sind alle Informationen, die zur Identifizierung einer Person, eines Wohnsitzes oder eines Bauernhofs verwendet werden können. Dazu können beispielsweise Namen, E-Mail-Adressen, Geolokalisierung oder Tierarztaufzeichnungen gehören. Unabhängig von der Art der personenbezogenen Daten sollten die darin enthaltenen Daten sorgfältig verwaltet werden.
PII sollten geschützt und sicher sein, mit eingeschränkten Zugriffsanforderungen. Abhängig vom Anwendungsfall können die Daten möglicherweise umgewandelt werden, um die personenbezogenen Daten zu schützen. Beispielsweise können Geolokalisierungen in der räumlichen Granularität aufsteigen und Daten können in Regionen oder Zonen oder nach Ländern bereitgestellt werden. E-Mail-Adressen, Telefonnummern und Namen von Farmen können bei der Aufnahme verschlüsselt und aus Datentabellen entfernt werden.
Sichere Datenspeicherinfrastruktur
Da es sich bei der GBADs Knowledge Engine um einen Cloud-Dienst handelt, werden alle Daten, die personenbezogene Daten enthalten, in einem sicheren Bucket gespeichert, beispielsweise im Amazon S3-Bucket.
Lizenzierung
Lizenzen legen fest, wer auf Daten zugreifen kann, wie Daten verwendet werden können, von wem sie zu welchen Zwecken verwendet werden dürfen und wie die Daten ordnungsgemäß zugeordnet werden können.
Lizenznutzungen
Lizenzen verfügen über drei Dienstprogramme für GBADs, die jeweils auf den CARE-Grundsätzen basieren:
- Schützen Sie Datenmitwirkende Jedes Mal, wenn Daten zu GBADs beigetragen werden, müssen Dateninhaber eine Lizenz für ihre Daten auswählen.
Dabei handelt es sich um einen CARE-Sharing-Mechanismus, da Lizenzen es Datenmitwirkenden ermöglichen, die Befugnis zur Kontrolle ihrer Daten während des gesamten Lebenszyklus zu haben, und mit Lizenzen, die die Nutzungsbeschränkungen der Daten vorschreiben, können die Daten zum kollektiven Nutzen des Dateninhabers einzeln oder individuell verwendet werden die Gruppe, die der Dateninhaber repräsentiert.
Öffentlich verfügbare Lizenzen werden in den Metadaten verlinkt und die Zitier-/Attributionsinformationen werden zusammen mit dem Datensatz verbreitet.
Datennutzer informieren Jeder Datensatz wird lizenziert und die Lizenz- und Zitierinformationen werden in den Metadaten des Datensatzes verfügbar sein. Daher werden Datennutzer darüber informiert, wie sie die Daten, auf die sie zugreifen, verwenden können und welche Quellenangabe sie verwenden müssen.
Systemansicht informieren Offene und öffentliche Daten stehen jedem Benutzer zur Verfügung, der die Site betritt. Gruppen- oder benannte Zugriffsdaten erfordern jedoch eine Authentifizierung und sind daher standardmäßig nicht zugänglich.
Mit anderen Worten: Die Ansicht der GBADs Knowledge Engine wird durch die Lizenzvereinbarung bestimmt. In einigen Fällen kann dies dazu führen, dass unbefugten Benutzern nicht einmal die Metadaten angezeigt werden. In anderen Fällen sind die beschreibenden Metadaten möglicherweise verfügbar und Benutzer können Zugriff anfordern. Was die Öffentlichkeit oder bestimmte Benutzer und Gruppen sehen können, wird durch die Entscheidungen des Datenbenutzers bestimmt.
Lizenzauswahl
Dateninhaber, die Open-Access- oder Public-Access-Daten bereitstellen, müssen eine Lizenzvereinbarung für ihre Daten abschließen. Es gibt eine Reihe von Datenlizenzvereinbarungen, aus denen Dateninhaber wählen können. Diese beinhalten:
- Creative-Commons-Lizenzen. Das Creative Commons-Lizenzauswahltool ermöglicht es Einzelpersonen, die Funktionen der Nutzung, Anpassung und Weitergabe auszuwählen und stellt eine Lizenz bereit, die diese Präferenzen widerspiegelt.
- Open Data Commons-Lizenzen, einschließlich der Open Data Commons Open Database License (ODbl), der Open Data Commons Attribution License und die Open Data Commons Public Domain Dedication and License (PDDL).
Zukünftige Richtungen
In einigen Fällen müssen Vereinbarungen über private Daten mit einem Rechtsteam getroffen werden, um sicherzustellen, dass die Nutzungsbeschränkungen, die Sicherheit und die Lizenzinformationen ordnungsgemäß zwischen dem Dateninhaber und den GBADs vereinbart werden.