Wikidata ist seit 2012 die strukturierte, sprachunabhängige Schwester der Wikipedia — eine kollaborativ gepflegte Linked-Data-Wissensbasis unter CC0-Lizenz. Aktuell enthält sie über 110 Millionen Items und wird von einer aktiven Editor-Community gepflegt. Für GLAM-Institutionen ist Wikidata heute der am leichtesten zugängliche Linked-Open-Data-Hub: niedrige Eintrittshürde, mächtiger SPARQL-Endpoint, freie Lizenz, Querverweise zu GND, VIAF, ORCID, Getty-AAT, ULAN, ISNI und Hunderten weiterer Authority-Systeme.
Was die GND für den deutschsprachigen Raum ist, ist Wikidata global — mit dem Unterschied, dass jede:r mitbearbeiten kann und das Datenmodell deutlich offener ist.
Datenmodell
| Begriff | Form | Beispiel |
|---|---|---|
| Item | Q + Nummer | Q5879 (Johann Wolfgang von Goethe) |
| Property | P + Nummer | P227 (GND-ID), P569 (Geburtsdatum) |
| Statement | Item — Property — Value | Q5879 P569 "1749-08-28" |
| Qualifier | präzisiert ein Statement | P580 (Beginn), P582 (Ende), P518 (gilt für) |
| Reference | belegt ein Statement | P248 (zitierte Quelle), P854 (URL) |
Jedes Item hat mehrsprachige Labels, Aliases und Descriptions — ein Wikidata-Q-ID ist ein einziger sprachunabhängiger Anker, dessen Beschriftung sich automatisch in die Sprache des Konsumenten anpasst.
@prefix wd: <http://www.wikidata.org/entity/> .
@prefix wdt: <http://www.wikidata.org/prop/direct/> .
wd:Q5879
rdfs:label "Johann Wolfgang von Goethe"@de ,
"Johann Wolfgang von Goethe"@en ,
"Иоганн Вольфганг фон Гёте"@ru ;
wdt:P31 wd:Q5 ; # instance of: Mensch
wdt:P569 "1749-08-28"^^xsd:date ; # Geburtsdatum
wdt:P570 "1832-03-22"^^xsd:date ; # Sterbedatum
wdt:P19 wd:Q1794 ; # Geburtsort: Frankfurt am Main
wdt:P227 "118540475" ; # GND-ID
wdt:P214 "24602065" ; # VIAF-ID
wdt:P496 "0000-0001-2345-6789" . # (Beispiel) ORCID
Wichtige Properties für GLAM
| Property | Bedeutung |
|---|---|
| P31 | instance of — Typ-Klassifikation (Q5 Mensch, Q3305213 Gemälde, Q41176 Gebäude) |
| P279 | subclass of — Klassen-Hierarchie |
| P569 / P570 | Geburts- / Sterbedatum |
| P19 / P20 | Geburts- / Sterbeort |
| P106 | Beruf / Tätigkeit |
| P170 | Schöpfer:in (eines Werkes) |
| P571 | Entstehungsdatum |
| P195 | Sammlung |
| P217 | Inventarnummer |
| P276 | Aufbewahrungsort |
| P18 | Bild (Commons-Datei) |
| P973 | beschrieben unter URL |
| P227 | GND-ID |
| P214 | VIAF-ID |
| P496 | ORCID-ID |
| P1014 | Getty AAT-ID |
| P245 | Getty ULAN-ID |
| P646 | Freebase-ID |
Diese „Brücken-Properties” sind der Hebel: ein einziges Wikidata-Item bündelt typisch 5–15 externe Authority-IDs und macht damit eine institutionelle Sammlung sofort an die ganze Linked-Data-Welt anschlussfähig.
Zugriff
1. Wikibase API
Klassische REST-/Web-API. Niedrigschwellig für Lookup, Suche, Bulk-Get.
# Item per ID abrufen (komprimiertes JSON)
curl 'https://www.wikidata.org/wiki/Special:EntityData/Q5879.json' | jq '.entities.Q5879.labels.de'
# Suche (gibt Q-IDs zurück)
curl 'https://www.wikidata.org/w/api.php?action=wbsearchentities&search=Goethe&language=de&format=json' | jq '.search[] | {id, label, description}'
2. SPARQL — query.wikidata.org
Der Wikidata Query Service ist das mächtigste Werkzeug für analytische Abfragen.
# Alle in Zürich geborenen Architekt:innen mit GND-ID und Wikipedia-Artikel (DE)
SELECT ?person ?personLabel ?gnd ?article WHERE {
?person wdt:P19 wd:Q72 ; # geboren in Zürich
wdt:P106 wd:Q42973 ; # Architekt:in
wdt:P227 ?gnd .
?article schema:about ?person ;
schema:isPartOf <https://de.wikipedia.org/> .
SERVICE wikibase:label { bd:serviceParam wikibase:language "de" }
}
LIMIT 50
SERVICE wikibase:label ist der idiomatische Weg, um Labels in der gewünschten Sprache zu bekommen — anstatt sie in jedem OPTIONAL-Block manuell zu joinen.
3. Linked Data Fragments
Für sehr grosse oder verteilte Abfragen jenseits des SPARQL-Timeout-Limits: https://query.wikidata.org/bigdata/ldf als TPF-Endpoint.
4. Direkter URI-Zugriff (Content Negotiation)
curl -H 'Accept: text/turtle' https://www.wikidata.org/entity/Q5879
curl -H 'Accept: application/ld+json' https://www.wikidata.org/entity/Q5879
GLAM-Workflows
Reconciliation
Wikidata stellt einen OpenRefine-Reconciliation-Endpoint bereit — die Standard-Methode, um Tabellen mit Personennamen, Ortsbezeichnungen oder Werktiteln gegen Wikidata zu mappen. Erkennt Disambiguierungen, schlägt Treffer vor, exportiert Q-IDs zurück in die Tabelle.
Mix’n’Match
Magnus Manskes Mix’n’Match ist eine Plattform, auf der Institutionen ihre Authority-Datensätze hochladen können, um sie crowd-getrieben gegen Wikidata-Items zu matchen. Niedrigschwellig für nicht-technische Erschliesser:innen.
Strukturierte Daten auf Commons
Über Wikimedia Commons (Bilddatenbank) lassen sich Sammlungsbilder mit Wikidata-Statements anreichern (P180 “depicts”, P170 “creator”). Damit werden Bilder zu strukturierten Linked-Data-Objekten — relevant für IIIF-Manifeste und Cross-Institutionen-Suche.
Wikibase als Eigeninstallation
Die Wikibase-Software (Wikidata-Engine) lässt sich lokal installieren — als institutsspezifische Linked-Data-Plattform mit dem gleichen Datenmodell. Wird u. a. von der Deutschen Nationalbibliothek (für FactGrid), der ETH-Bibliothek und einigen Forschungsprojekten eingesetzt.
Cross-Linking via Wikidata
Der eigentliche Wert von Wikidata für eine Sammlung entsteht in der Verknüpfung:
# Wer ist als "Goethe" referenziert mit GND-ID 118540475 in Wikidata?
SELECT ?item ?itemLabel WHERE {
?item wdt:P227 "118540475" .
SERVICE wikibase:label { bd:serviceParam wikibase:language "de" }
}
# → wd:Q5879
# Welche Werke hat dieser Goethe geschaffen?
SELECT ?work ?workLabel WHERE {
?work wdt:P50 wd:Q5879 . # P50 = Autor:in
SERVICE wikibase:label { bd:serviceParam wikibase:language "de" }
}
Damit wird aus einer GND-Verlinkung in der eigenen Datenbank der Anschluss an: alle Werke des Autors, alle Übersetzungen, alle Biographien, alle Bilder auf Commons, alle anderen Authority-IDs.
Verhältnis zu anderen Standards
- GND — komplementär. GND ist autoritativ und kuratierter; Wikidata ist offener und globaler. Beide IDs gehören in den Datensatz.
- VIAF — internationaler Authority-Aggregator. Wikidata referenziert VIAF via P214 und ist umgekehrt eine VIAF-Quelle.
- ORCID — für lebende Forschende; Wikidata-Items haben P496-Property.
- schema.org — Wikidata-Items lassen sich auf
schema:Thing-Subtypen mappen; Tools wiewdshexgenerieren das automatisch. - CIDOC-CRM — Wikidata kann als Source-Hub für CRM-Klassifikationen dienen, etwa via
crm:E55_Type. - SKOS — eingeschränkter Mapping-Pfad: nicht alle Wikidata-Items sind als SKOS-Concepts modellierbar.
- Wikipedia — jeder Wikipedia-Artikel hat ein Wikidata-Item, aber nicht jedes Wikidata-Item hat einen Wikipedia-Artikel. Über die Sitelinks-Property entsteht die Brücke.
Werkzeuge
- Wikidata Query Service (query.wikidata.org) — interaktive SPARQL-Workbench mit Visualisierungen (Tabelle, Graph, Karte, Timeline)
- OpenRefine mit Wikidata-Reconciliation und Wikidata-Upload-Schema-Editor
- Mix’n’Match — crowd-Matching von externen Identifier-Listen
- PetScan — Listengenerator über Kategorien, Properties, Sprachen
- QuickStatements — Massen-Edit-Tool für Wikidata (CSV-basiert)
kraenzle-ritter/resources— Laravel-Trait, der u. a. Wikidata, GND, Geonames und Metagrid an Eloquent-Modelle anflanscht; in der Sammlungs-Software Anton als Authority-Layer eingesetzt- wikibase-cli — Node-basiertes CLI für Skripte
- WikidataIntegrator (Python) — Bibliothek für programmatische Wikidata-Edits
Lizenz und Datenschutz
- CC0 für die Datenbank-Inhalte. Vollständig frei nutzbar inkl. kommerziell, ohne Attribution-Pflicht — die einfachste Lizenz, die es gibt.
- Personenbezug: Wikidata pflegt Daten zu lebenden Personen unter denselben Wikipedia-Notability-Regeln. Vor dem Anlegen eigener Personen-Items prüfen, ob die Person die Relevanzkriterien erfüllt.
- Vandalismus-Risiko: Wikidata kann von jeder/m editiert werden. Für Produktiv-Joins lohnt sich ein Snapshot und/oder das Filtern auf Statements mit „referenced”-Status, statt Live-Abfrage gegen das Frontend.
Häufige Fallen
- Q-ID-Wechsel: Wenn ein Item gelöscht oder mit einem anderen vereinigt wird, redirectet die Q-ID — Live-Lookups funktionieren weiter, aber lokal gespeicherte Q-IDs sollten regelmässig auf Redirect geprüft werden.
- „Truthiness”: Wikidata kennt mehrere Statement-Ranks (preferred, normal, deprecated).
wdt:-Properties geben die truthy Aussage; für vollständigen Zugriffp:undps:nutzen. - Sprache schiefgegangen: Ein Item ohne
de-Label fällt in Querys auf den Q-ID-Identifier zurück. MitOPTIONALundCOALESCEoder dem Service-Block absichern. - Performance: Komplexe Querys über Millionen Items können das 60-Sekunden-Timeout reissen.
LIMIT,MINUSund das Vermeiden vonOPTIONAL-Ketten helfen; alternativ TPF/LDF-Endpoint. - Authority-IDs nicht überprüft: Properties wie P227 (GND-ID) sind crowd-eingetragen; einzelne falsche Mappings sind selten, aber möglich. Im Zweifel kreuzgegen GND validieren.
- Wikidata ist keine Quelle, sondern eine Aggregation: Statements ohne Reference-Block sind oft unbelegt. Für wissenschaftliche Nachweise lieber die referenzierten Quellen direkt zitieren.