FAIR steht für Findable · Accessible · Interoperable · Reusable — vier Leitprinzipien für die nachhaltige Veröffentlichung und Nachnutzung digitaler Daten, formuliert 2016 von Wilkinson et al. im Rahmen der Force11- und GO-FAIR-Initiativen. Ursprünglich für Forschungsdaten in den Life Sciences gedacht, sind die Prinzipien heute Standard-Erwartung in der EU-Forschungs­förderung (Horizon Europe), bei DataCite, beim Schweizer DLCM und in der wissenschaftlichen Verlagswelt — und sie werden zunehmend zur Bewertungs­linse für Sammlungs-APIs, Editionen und Linked-Open-Data-Bestände in GLAM-Institutionen.

Wichtig vorweg: FAIR ≠ Open. FAIR-Daten dürfen zugangsbeschränkt sein, solange die Metadaten findbar bleiben und der Zugriffsweg dokumentiert ist. Die häufige Gleichsetzung von „FAIR” mit „frei verfügbar” ist eine Vereinfachung, die der Praxis nicht gerecht wird.

Die vier Pillars mit Sub-Prinzipien

PillarSub-Prinzipien
FindableF1 — globale, persistente Identifikatoren · F2 — reiche Metadaten · F3 — Metadaten enthalten den Identifier des Datensatzes · F4 — registriert/indexiert in einer durchsuchbaren Ressource
AccessibleA1 — abrufbar via standardisiertes Protokoll · A1.1 — Protokoll ist offen, frei, universell implementierbar · A1.2 — Protokoll erlaubt Authentifizierung/Autorisierung wo nötig · A2 — Metadaten bleiben erreichbar, auch wenn die Daten verschwinden
InteroperableI1 — formale, gemeinsam getragene Sprache der Wissens­repräsentation · I2 — Vokabulare folgen ihrerseits FAIR-Prinzipien · I3 — qualifizierte Verweise auf andere (Meta-)Daten
ReusableR1 — reich beschrieben mit relevanten Attributen · R1.1 — klare, zugängliche Nutzungs­lizenz · R1.2 — detaillierte Provenienz · R1.3 — Community-Standards der Domäne

Drei häufige Missverständnisse

  • „FAIR = Open” — falsch. Personenbezogene Forschungsdaten oder rechte­geschützte Sammlungs­objekte können FAIR sein, ohne öffentlich zugänglich zu sein. Entscheidend ist, dass Metadaten findbar und der Zugriffsweg dokumentiert ist.
  • „Wir haben einen Server, also FAIR” — Findability ohne reiche, kontrolliert vokabularisierte Metadaten ist hohl. Ein PDF auf einer Website mit Filename-only ist nicht findable im FAIR-Sinn.
  • „Maschinenlesbarkeit ist optional” — I1 und I3 verlangen formale Repräsentation (RDF, JSON-LD, strukturiertes XML). HTML-Seiten mit textuellen Metadaten erfüllen das nicht.

FAIR in der GLAM-Praxis

Zu jedem Pillar lassen sich konkrete Werkzeuge zuordnen, die GLAM-Institutionen heute haben oder brauchen:

PillarGLAM-Bezug
F1 (PID)DOI · ARK · Handle · URN — siehe auch persistente Identifikatoren als eigene Authority-Strategie
F4 (Indexierung)OAI-PMH · IIIF Change Discovery · Aggregator-Lieferung an Europeana, DDB, DPLA, Memobase
A1 (offenes Protokoll)HTTP · IIIF · OAI-PMH · SPARQL-Endpoint
I2 (FAIR-Vokabulare)GND · Wikidata · GeoNames · Metagrid · Getty AAT/ULAN/TGN · SKOS-publizierte Thesauri
I3 (qualifizierte Verweise)CIDOC-CRM · schema.org · RiC-O · TEI mit <relation>-Markup
R1.1 (Lizenz)Creative Commons · Rights Statements (rightsstatements.org) · Public-Domain-Mark
R1.2 (Provenienz)PREMIS und PREMIS-Events für Bitstream/Content-Provenienz; dct:source, dc:provenance, CIDOC-CRM-Events für Sammlungs-Provenienz
R1.3 (Community-Standards)Dublin Core · LIDO · EAD · TEI je nach Domäne

Konkret: Eine Sammlungs-Datenbank wird FAIR, wenn sie persistente IDs vergibt (F1), via OAI-PMH/IIIF auslieferbar ist (A1, F4), Authority-Verknüpfungen zu GND/Wikidata/Metagrid pflegt (I2, I3), eine CC-Lizenz pro Objekt führt (R1.1) und über Provenienz-Felder die Erschliessungs-Geschichte protokolliert (R1.2).

Komplementäre Frameworks

  • CARE-Prinzipien (Collective benefit · Authority to control · Responsibility · Ethics) — ergänzen FAIR um indigene und communautäre Daten­souveränität. Antwort auf die Beobachtung, dass FAIR allein „Daten frei für alle” zu wenig differenziert. Relevant bei ethnologischen Sammlungen und Beständen mit Provenienz aus kolonialen Kontexten.
  • TRUST-Prinzipien (Transparency · Responsibility · User focus · Sustainability · Technology) — für die Vertrauenswürdigkeit von Repositorien selbst.
  • 5-Sterne-Linked-Data-Modell (Tim Berners-Lee) — orthogonale Hierarchie zur Linked-Data-Reife einer Veröffentlichung; deckt sich teilweise mit Interoperability.

Bewertung — wie misst man FAIR?

Mehrere automatisierte und manuelle Werkzeuge prüfen, wie FAIR ein Datensatz ist:

  • F-UJI (FAIRsFAIR) — automatisierter Test für eine DOI/URL; gibt Score pro Sub-Prinzip und konkrete Empfehlungen
  • FAIR Evaluator (Wilkinson et al.) — der „offizielle” Maturity-Test mit detaillierten Indikatoren
  • FAIR Data Point — Spezifikation für einen Server, der FAIR-Metadaten standardisiert ausliefert
  • FAIRsharing.org — Verzeichnis, das selbst FAIR-Standards, -Vokabulare und -Repositorien katalogisiert

In der Praxis ergibt eine F-UJI-Auswertung der eigenen Sammlungs-API einen guten Ausgangspunkt für eine Roadmap: Welche Sub-Prinzipien sind erfüllt, wo gibt es Lücken, was bringt mit wenig Aufwand am meisten.

Schweizer Kontext

  • DLCM (Data Life Cycle Management) — schweizweite Infrastruktur-Initiative für Forschungs­datenmanagement, mit FAIR als Leitprinzip; bietet Beratung, Tools (DLCM Service Provider) und Hosting für Schweizer Hochschulen.
  • swissuniversities verlangt für Forschungs­förderungs­anträge (P-5-Programm „Open Science”) FAIR-konforme Datenverwaltung.
  • SAGW unterstützt FAIR-Adoption in den Geistes- und Sozial­wissenschaften, u. a. über Infrastruktur-Dienste wie Metagrid.
  • OLOS (Object Long-term Online Storage) und Yareta (Genève) als Schweizer FAIR-konforme Repository-Services.
  • Memoriav und BAR / KOST treiben FAIR-Aspekte für AV-Bestände bzw. Verwaltungs­akten voran, ohne das Akronym immer prominent zu führen.

Verhältnis zu anderen Standards

  • OAIS — OAIS bedient mehrere FAIR-Aspekte: Findability über AIPs mit Identifiern, Reusability über die PDI-Komponente. FAIR ist abstrakter, OAIS konkreter operationalisiert.
  • IIIF — Image-/Presentation-API ist faktisch eine FAIR-Implementation für Bildbestände: stabile URIs (F1), offenes Protokoll (A1), JSON-LD-Manifeste (I1), Cross-Manifest-Annotationen (I3).
  • Persistente Identifikatoren (DOI, ARK, Handle, URN) — F1 direkt; ohne stabile IDs ist kein FAIR möglich.
  • Linked Open Data — fünf-Sterne-Daten erfüllen automatisch viele Interoperability- und Reusability-Sub-Prinzipien.
  • Creative Commons — R1.1 direkt; CC0/CC BY/CC BY-SA sind die in der Forschung gängigsten FAIR-konformen Lizenzen.

Häufige Fallen

  • „FAIR-konform” als Selbstattest — ohne externe Prüfung (F-UJI o. ä.) ist die Aussage wenig belastbar. In Förderanträgen erwarten Reviewer zunehmend konkrete Belege pro Sub-Prinzip.
  • Identifier ohne Auflösung — eine DOI, die nirgendwo registriert ist, oder ein ARK ohne Resolver bricht F1.
  • Vokabular-Verwendung ohne Linked Datasubject: "Reformation" als Freitext erfüllt I2 nicht; nötig ist subject: <https://d-nb.info/gnd/4049387-9>.
  • Lizenz-Lücken — CC0/CC BY für Daten und Metadaten separat deklarieren. Häufig ist die Lizenz nur für die Daten, nicht für die Metadaten geregelt.
  • Provenienz auf Sammlungsebene statt pro Objekt — R1.2 verlangt detaillierte Provenienz; ein „aus dem Bestand X” reicht nicht, wenn das Sammlungs­objekt selbst eine Geschichte hat.
  • Versionierung vergessen — wenn sich Daten ändern, müssen Versionen identifizierbar bleiben. F1 verlangt implizit Versions-Identifier.
  • CARE-blind FAIR umsetzen — bei ethno­grafischen oder indigenen Sammlungen kann reines FAIR ohne CARE problematisch sein. Vor Massen-Open-Publikation Communities einbeziehen.