Wikidata ist seit 2012 die strukturierte, sprachunabhängige Schwester der Wikipedia — eine kollaborativ gepflegte Linked-Data-Wissensbasis unter CC0-Lizenz. Aktuell enthält sie über 110 Millionen Items und wird von einer aktiven Editor-Community gepflegt. Für GLAM-Institutionen ist Wikidata heute der am leichtesten zugängliche Linked-Open-Data-Hub: niedrige Eintrittshürde, mächtiger SPARQL-Endpoint, freie Lizenz, Querverweise zu GND, VIAF, ORCID, Getty-AAT, ULAN, ISNI und Hunderten weiterer Authority-Systeme.

Was die GND für den deutschsprachigen Raum ist, ist Wikidata global — mit dem Unterschied, dass jede:r mitbearbeiten kann und das Datenmodell deutlich offener ist.

Datenmodell

BegriffFormBeispiel
ItemQ + NummerQ5879 (Johann Wolfgang von Goethe)
PropertyP + NummerP227 (GND-ID), P569 (Geburtsdatum)
StatementItem — Property — ValueQ5879 P569 "1749-08-28"
Qualifierpräzisiert ein StatementP580 (Beginn), P582 (Ende), P518 (gilt für)
Referencebelegt ein StatementP248 (zitierte Quelle), P854 (URL)

Jedes Item hat mehrsprachige Labels, Aliases und Descriptions — ein Wikidata-Q-ID ist ein einziger sprachunabhängiger Anker, dessen Beschriftung sich automatisch in die Sprache des Konsumenten anpasst.

@prefix wd: <http://www.wikidata.org/entity/> .
@prefix wdt: <http://www.wikidata.org/prop/direct/> .

wd:Q5879
  rdfs:label "Johann Wolfgang von Goethe"@de ,
             "Johann Wolfgang von Goethe"@en ,
             "Иоганн Вольфганг фон Гёте"@ru ;
  wdt:P31    wd:Q5 ;                                # instance of: Mensch
  wdt:P569   "1749-08-28"^^xsd:date ;               # Geburtsdatum
  wdt:P570   "1832-03-22"^^xsd:date ;               # Sterbedatum
  wdt:P19    wd:Q1794 ;                             # Geburtsort: Frankfurt am Main
  wdt:P227   "118540475" ;                          # GND-ID
  wdt:P214   "24602065" ;                           # VIAF-ID
  wdt:P496   "0000-0001-2345-6789" .                # (Beispiel) ORCID

Wichtige Properties für GLAM

PropertyBedeutung
P31instance of — Typ-Klassifikation (Q5 Mensch, Q3305213 Gemälde, Q41176 Gebäude)
P279subclass of — Klassen-Hierarchie
P569 / P570Geburts- / Sterbedatum
P19 / P20Geburts- / Sterbeort
P106Beruf / Tätigkeit
P170Schöpfer:in (eines Werkes)
P571Entstehungsdatum
P195Sammlung
P217Inventarnummer
P276Aufbewahrungsort
P18Bild (Commons-Datei)
P973beschrieben unter URL
P227GND-ID
P214VIAF-ID
P496ORCID-ID
P1014Getty AAT-ID
P245Getty ULAN-ID
P646Freebase-ID

Diese „Brücken-Properties” sind der Hebel: ein einziges Wikidata-Item bündelt typisch 5–15 externe Authority-IDs und macht damit eine institutionelle Sammlung sofort an die ganze Linked-Data-Welt anschlussfähig.

Zugriff

1. Wikibase API

Klassische REST-/Web-API. Niedrigschwellig für Lookup, Suche, Bulk-Get.

# Item per ID abrufen (komprimiertes JSON)
curl 'https://www.wikidata.org/wiki/Special:EntityData/Q5879.json' | jq '.entities.Q5879.labels.de'

# Suche (gibt Q-IDs zurück)
curl 'https://www.wikidata.org/w/api.php?action=wbsearchentities&search=Goethe&language=de&format=json' | jq '.search[] | {id, label, description}'

2. SPARQL — query.wikidata.org

Der Wikidata Query Service ist das mächtigste Werkzeug für analytische Abfragen.

# Alle in Zürich geborenen Architekt:innen mit GND-ID und Wikipedia-Artikel (DE)
SELECT ?person ?personLabel ?gnd ?article WHERE {
  ?person wdt:P19 wd:Q72 ;          # geboren in Zürich
          wdt:P106 wd:Q42973 ;       # Architekt:in
          wdt:P227 ?gnd .
  ?article schema:about ?person ;
           schema:isPartOf <https://de.wikipedia.org/> .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "de" }
}
LIMIT 50

SERVICE wikibase:label ist der idiomatische Weg, um Labels in der gewünschten Sprache zu bekommen — anstatt sie in jedem OPTIONAL-Block manuell zu joinen.

3. Linked Data Fragments

Für sehr grosse oder verteilte Abfragen jenseits des SPARQL-Timeout-Limits: https://query.wikidata.org/bigdata/ldf als TPF-Endpoint.

4. Direkter URI-Zugriff (Content Negotiation)

curl -H 'Accept: text/turtle' https://www.wikidata.org/entity/Q5879
curl -H 'Accept: application/ld+json' https://www.wikidata.org/entity/Q5879

GLAM-Workflows

Reconciliation

Wikidata stellt einen OpenRefine-Reconciliation-Endpoint bereit — die Standard-Methode, um Tabellen mit Personennamen, Ortsbezeichnungen oder Werktiteln gegen Wikidata zu mappen. Erkennt Disambiguierungen, schlägt Treffer vor, exportiert Q-IDs zurück in die Tabelle.

Mix’n’Match

Magnus Manskes Mix’n’Match ist eine Plattform, auf der Institutionen ihre Authority-Datensätze hochladen können, um sie crowd-getrieben gegen Wikidata-Items zu matchen. Niedrigschwellig für nicht-technische Erschliesser:innen.

Strukturierte Daten auf Commons

Über Wikimedia Commons (Bilddatenbank) lassen sich Sammlungsbilder mit Wikidata-Statements anreichern (P180 “depicts”, P170 “creator”). Damit werden Bilder zu strukturierten Linked-Data-Objekten — relevant für IIIF-Manifeste und Cross-Institutionen-Suche.

Wikibase als Eigeninstallation

Die Wikibase-Software (Wikidata-Engine) lässt sich lokal installieren — als institutsspezifische Linked-Data-Plattform mit dem gleichen Datenmodell. Wird u. a. von der Deutschen Nationalbibliothek (für FactGrid), der ETH-Bibliothek und einigen Forschungsprojekten eingesetzt.

Cross-Linking via Wikidata

Der eigentliche Wert von Wikidata für eine Sammlung entsteht in der Verknüpfung:

# Wer ist als "Goethe" referenziert mit GND-ID 118540475 in Wikidata?
SELECT ?item ?itemLabel WHERE {
  ?item wdt:P227 "118540475" .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "de" }
}
# → wd:Q5879

# Welche Werke hat dieser Goethe geschaffen?
SELECT ?work ?workLabel WHERE {
  ?work wdt:P50 wd:Q5879 .          # P50 = Autor:in
  SERVICE wikibase:label { bd:serviceParam wikibase:language "de" }
}

Damit wird aus einer GND-Verlinkung in der eigenen Datenbank der Anschluss an: alle Werke des Autors, alle Übersetzungen, alle Biographien, alle Bilder auf Commons, alle anderen Authority-IDs.

Verhältnis zu anderen Standards

  • GND — komplementär. GND ist autoritativ und kuratierter; Wikidata ist offener und globaler. Beide IDs gehören in den Datensatz.
  • VIAF — internationaler Authority-Aggregator. Wikidata referenziert VIAF via P214 und ist umgekehrt eine VIAF-Quelle.
  • ORCID — für lebende Forschende; Wikidata-Items haben P496-Property.
  • schema.org — Wikidata-Items lassen sich auf schema:Thing-Subtypen mappen; Tools wie wdshex generieren das automatisch.
  • CIDOC-CRM — Wikidata kann als Source-Hub für CRM-Klassifikationen dienen, etwa via crm:E55_Type.
  • SKOS — eingeschränkter Mapping-Pfad: nicht alle Wikidata-Items sind als SKOS-Concepts modellierbar.
  • Wikipedia — jeder Wikipedia-Artikel hat ein Wikidata-Item, aber nicht jedes Wikidata-Item hat einen Wikipedia-Artikel. Über die Sitelinks-Property entsteht die Brücke.

Werkzeuge

  • Wikidata Query Service (query.wikidata.org) — interaktive SPARQL-Workbench mit Visualisierungen (Tabelle, Graph, Karte, Timeline)
  • OpenRefine mit Wikidata-Reconciliation und Wikidata-Upload-Schema-Editor
  • Mix’n’Match — crowd-Matching von externen Identifier-Listen
  • PetScan — Listengenerator über Kategorien, Properties, Sprachen
  • QuickStatements — Massen-Edit-Tool für Wikidata (CSV-basiert)
  • kraenzle-ritter/resources — Laravel-Trait, der u. a. Wikidata, GND, Geonames und Metagrid an Eloquent-Modelle anflanscht; in der Sammlungs-Software Anton als Authority-Layer eingesetzt
  • wikibase-cli — Node-basiertes CLI für Skripte
  • WikidataIntegrator (Python) — Bibliothek für programmatische Wikidata-Edits

Lizenz und Datenschutz

  • CC0 für die Datenbank-Inhalte. Vollständig frei nutzbar inkl. kommerziell, ohne Attribution-Pflicht — die einfachste Lizenz, die es gibt.
  • Personenbezug: Wikidata pflegt Daten zu lebenden Personen unter denselben Wikipedia-Notability-Regeln. Vor dem Anlegen eigener Personen-Items prüfen, ob die Person die Relevanzkriterien erfüllt.
  • Vandalismus-Risiko: Wikidata kann von jeder/m editiert werden. Für Produktiv-Joins lohnt sich ein Snapshot und/oder das Filtern auf Statements mit „referenced”-Status, statt Live-Abfrage gegen das Frontend.

Häufige Fallen

  • Q-ID-Wechsel: Wenn ein Item gelöscht oder mit einem anderen vereinigt wird, redirectet die Q-ID — Live-Lookups funktionieren weiter, aber lokal gespeicherte Q-IDs sollten regelmässig auf Redirect geprüft werden.
  • „Truthiness”: Wikidata kennt mehrere Statement-Ranks (preferred, normal, deprecated). wdt:-Properties geben die truthy Aussage; für vollständigen Zugriff p: und ps: nutzen.
  • Sprache schiefgegangen: Ein Item ohne de-Label fällt in Querys auf den Q-ID-Identifier zurück. Mit OPTIONAL und COALESCE oder dem Service-Block absichern.
  • Performance: Komplexe Querys über Millionen Items können das 60-Sekunden-Timeout reissen. LIMIT, MINUS und das Vermeiden von OPTIONAL-Ketten helfen; alternativ TPF/LDF-Endpoint.
  • Authority-IDs nicht überprüft: Properties wie P227 (GND-ID) sind crowd-eingetragen; einzelne falsche Mappings sind selten, aber möglich. Im Zweifel kreuzgegen GND validieren.
  • Wikidata ist keine Quelle, sondern eine Aggregation: Statements ohne Reference-Block sind oft unbelegt. Für wissenschaftliche Nachweise lieber die referenzierten Quellen direkt zitieren.