FAIR steht für Findable · Accessible · Interoperable · Reusable — vier Leitprinzipien für die nachhaltige Veröffentlichung und Nachnutzung digitaler Daten, formuliert 2016 von Wilkinson et al. im Rahmen der Force11- und GO-FAIR-Initiativen. Ursprünglich für Forschungsdaten in den Life Sciences gedacht, sind die Prinzipien heute Standard-Erwartung in der EU-Forschungsförderung (Horizon Europe), bei DataCite, beim Schweizer DLCM und in der wissenschaftlichen Verlagswelt — und sie werden zunehmend zur Bewertungslinse für Sammlungs-APIs, Editionen und Linked-Open-Data-Bestände in GLAM-Institutionen.
Wichtig vorweg: FAIR ≠ Open. FAIR-Daten dürfen zugangsbeschränkt sein, solange die Metadaten findbar bleiben und der Zugriffsweg dokumentiert ist. Die häufige Gleichsetzung von „FAIR” mit „frei verfügbar” ist eine Vereinfachung, die der Praxis nicht gerecht wird.
Die vier Pillars mit Sub-Prinzipien
| Pillar | Sub-Prinzipien |
|---|---|
| Findable | F1 — globale, persistente Identifikatoren · F2 — reiche Metadaten · F3 — Metadaten enthalten den Identifier des Datensatzes · F4 — registriert/indexiert in einer durchsuchbaren Ressource |
| Accessible | A1 — abrufbar via standardisiertes Protokoll · A1.1 — Protokoll ist offen, frei, universell implementierbar · A1.2 — Protokoll erlaubt Authentifizierung/Autorisierung wo nötig · A2 — Metadaten bleiben erreichbar, auch wenn die Daten verschwinden |
| Interoperable | I1 — formale, gemeinsam getragene Sprache der Wissensrepräsentation · I2 — Vokabulare folgen ihrerseits FAIR-Prinzipien · I3 — qualifizierte Verweise auf andere (Meta-)Daten |
| Reusable | R1 — reich beschrieben mit relevanten Attributen · R1.1 — klare, zugängliche Nutzungslizenz · R1.2 — detaillierte Provenienz · R1.3 — Community-Standards der Domäne |
Drei häufige Missverständnisse
- „FAIR = Open” — falsch. Personenbezogene Forschungsdaten oder rechtegeschützte Sammlungsobjekte können FAIR sein, ohne öffentlich zugänglich zu sein. Entscheidend ist, dass Metadaten findbar und der Zugriffsweg dokumentiert ist.
- „Wir haben einen Server, also FAIR” — Findability ohne reiche, kontrolliert vokabularisierte Metadaten ist hohl. Ein PDF auf einer Website mit Filename-only ist nicht findable im FAIR-Sinn.
- „Maschinenlesbarkeit ist optional” — I1 und I3 verlangen formale Repräsentation (RDF, JSON-LD, strukturiertes XML). HTML-Seiten mit textuellen Metadaten erfüllen das nicht.
FAIR in der GLAM-Praxis
Zu jedem Pillar lassen sich konkrete Werkzeuge zuordnen, die GLAM-Institutionen heute haben oder brauchen:
| Pillar | GLAM-Bezug |
|---|---|
| F1 (PID) | DOI · ARK · Handle · URN — siehe auch persistente Identifikatoren als eigene Authority-Strategie |
| F4 (Indexierung) | OAI-PMH · IIIF Change Discovery · Aggregator-Lieferung an Europeana, DDB, DPLA, Memobase |
| A1 (offenes Protokoll) | HTTP · IIIF · OAI-PMH · SPARQL-Endpoint |
| I2 (FAIR-Vokabulare) | GND · Wikidata · GeoNames · Metagrid · Getty AAT/ULAN/TGN · SKOS-publizierte Thesauri |
| I3 (qualifizierte Verweise) | CIDOC-CRM · schema.org · RiC-O · TEI mit <relation>-Markup |
| R1.1 (Lizenz) | Creative Commons · Rights Statements (rightsstatements.org) · Public-Domain-Mark |
| R1.2 (Provenienz) | PREMIS und PREMIS-Events für Bitstream/Content-Provenienz; dct:source, dc:provenance, CIDOC-CRM-Events für Sammlungs-Provenienz |
| R1.3 (Community-Standards) | Dublin Core · LIDO · EAD · TEI je nach Domäne |
Konkret: Eine Sammlungs-Datenbank wird FAIR, wenn sie persistente IDs vergibt (F1), via OAI-PMH/IIIF auslieferbar ist (A1, F4), Authority-Verknüpfungen zu GND/Wikidata/Metagrid pflegt (I2, I3), eine CC-Lizenz pro Objekt führt (R1.1) und über Provenienz-Felder die Erschliessungs-Geschichte protokolliert (R1.2).
Komplementäre Frameworks
- CARE-Prinzipien (Collective benefit · Authority to control · Responsibility · Ethics) — ergänzen FAIR um indigene und communautäre Datensouveränität. Antwort auf die Beobachtung, dass FAIR allein „Daten frei für alle” zu wenig differenziert. Relevant bei ethnologischen Sammlungen und Beständen mit Provenienz aus kolonialen Kontexten.
- TRUST-Prinzipien (Transparency · Responsibility · User focus · Sustainability · Technology) — für die Vertrauenswürdigkeit von Repositorien selbst.
- 5-Sterne-Linked-Data-Modell (Tim Berners-Lee) — orthogonale Hierarchie zur Linked-Data-Reife einer Veröffentlichung; deckt sich teilweise mit Interoperability.
Bewertung — wie misst man FAIR?
Mehrere automatisierte und manuelle Werkzeuge prüfen, wie FAIR ein Datensatz ist:
- F-UJI (FAIRsFAIR) — automatisierter Test für eine DOI/URL; gibt Score pro Sub-Prinzip und konkrete Empfehlungen
- FAIR Evaluator (Wilkinson et al.) — der „offizielle” Maturity-Test mit detaillierten Indikatoren
- FAIR Data Point — Spezifikation für einen Server, der FAIR-Metadaten standardisiert ausliefert
- FAIRsharing.org — Verzeichnis, das selbst FAIR-Standards, -Vokabulare und -Repositorien katalogisiert
In der Praxis ergibt eine F-UJI-Auswertung der eigenen Sammlungs-API einen guten Ausgangspunkt für eine Roadmap: Welche Sub-Prinzipien sind erfüllt, wo gibt es Lücken, was bringt mit wenig Aufwand am meisten.
Schweizer Kontext
- DLCM (Data Life Cycle Management) — schweizweite Infrastruktur-Initiative für Forschungsdatenmanagement, mit FAIR als Leitprinzip; bietet Beratung, Tools (DLCM Service Provider) und Hosting für Schweizer Hochschulen.
- swissuniversities verlangt für Forschungsförderungsanträge (P-5-Programm „Open Science”) FAIR-konforme Datenverwaltung.
- SAGW unterstützt FAIR-Adoption in den Geistes- und Sozialwissenschaften, u. a. über Infrastruktur-Dienste wie Metagrid.
- OLOS (Object Long-term Online Storage) und Yareta (Genève) als Schweizer FAIR-konforme Repository-Services.
- Memoriav und BAR / KOST treiben FAIR-Aspekte für AV-Bestände bzw. Verwaltungsakten voran, ohne das Akronym immer prominent zu führen.
Verhältnis zu anderen Standards
- OAIS — OAIS bedient mehrere FAIR-Aspekte: Findability über AIPs mit Identifiern, Reusability über die PDI-Komponente. FAIR ist abstrakter, OAIS konkreter operationalisiert.
- IIIF — Image-/Presentation-API ist faktisch eine FAIR-Implementation für Bildbestände: stabile URIs (F1), offenes Protokoll (A1), JSON-LD-Manifeste (I1), Cross-Manifest-Annotationen (I3).
- Persistente Identifikatoren (DOI, ARK, Handle, URN) — F1 direkt; ohne stabile IDs ist kein FAIR möglich.
- Linked Open Data — fünf-Sterne-Daten erfüllen automatisch viele Interoperability- und Reusability-Sub-Prinzipien.
- Creative Commons — R1.1 direkt; CC0/CC BY/CC BY-SA sind die in der Forschung gängigsten FAIR-konformen Lizenzen.
Häufige Fallen
- „FAIR-konform” als Selbstattest — ohne externe Prüfung (F-UJI o. ä.) ist die Aussage wenig belastbar. In Förderanträgen erwarten Reviewer zunehmend konkrete Belege pro Sub-Prinzip.
- Identifier ohne Auflösung — eine DOI, die nirgendwo registriert ist, oder ein ARK ohne Resolver bricht F1.
- Vokabular-Verwendung ohne Linked Data —
subject: "Reformation"als Freitext erfüllt I2 nicht; nötig istsubject: <https://d-nb.info/gnd/4049387-9>. - Lizenz-Lücken — CC0/CC BY für Daten und Metadaten separat deklarieren. Häufig ist die Lizenz nur für die Daten, nicht für die Metadaten geregelt.
- Provenienz auf Sammlungsebene statt pro Objekt — R1.2 verlangt detaillierte Provenienz; ein „aus dem Bestand X” reicht nicht, wenn das Sammlungsobjekt selbst eine Geschichte hat.
- Versionierung vergessen — wenn sich Daten ändern, müssen Versionen identifizierbar bleiben. F1 verlangt implizit Versions-Identifier.
- CARE-blind FAIR umsetzen — bei ethnografischen oder indigenen Sammlungen kann reines FAIR ohne CARE problematisch sein. Vor Massen-Open-Publikation Communities einbeziehen.