CIDOC CRM (Conceptual Reference Model) ist eine formale Ontologie für die semantische Beschreibung von Kulturerbe-Informationen. Entwickelt seit den 1990er-Jahren von der CIDOC Documentation Standards Working Group (ICOM), wurde es 2006 als ISO 21127 standardisiert; die aktuelle Fassung ist die Version 7.x (auch als ISO 21127:2023).

Im Unterschied zu konkreten Daten- und Austausch-Schemata (etwa Dublin Core, EAD oder LIDO) ist CIDOC CRM ein konzeptionelles Modell: Es beschreibt nicht welche Felder eine Datenbank hat, sondern welche Klassen von Dingen es in der Welt der Kulturerbe-Information gibt und welche Beziehungen zwischen ihnen möglich sind. Datenmodelle einzelner Anwendungen werden als „CRM-Mappings” auf das Modell projiziert; daraus entsteht semantische Interoperabilität zwischen Sammlungen.

Kernidee: ereignis-zentriert

Die wichtigste konzeptionelle Entscheidung des CRM ist seine Ereignis-Zentriertheit. Statt direkte Beziehungen zwischen Objekten und Personen zu modellieren („dieses Objekt wurde von Person X geschaffen”), werden Ereignisse als eigene Entität eingeführt:

[Person X]  (P14 carried out by) ←  [Schöpfung E65]  → (P94 has created)  [Objekt Y]

                                    (P4 has time-span)

                                    [Zeitspanne 1820–1825]

                                    (P7 took place at)

                                    [Ort Zürich]

Das erlaubt, beliebige Aspekte einer Schöpfung, Übergabe, Reparatur oder Ausstellung mit denselben Mustern zu beschreiben — und mehrere unsichere/abweichende Aussagen über dasselbe Ereignis nebeneinander zu führen.

Klassen und Properties

Klassen sind mit E<Nummer> numeriert, Properties mit P<Nummer>. Im Kern arbeitet man mit relativ wenigen Klassen, daneben gibt es viele Spezialisierungen.

KlasseBedeutung
E21 Personnatürliche Person
E39 Actorhandelnde Entität (Person oder Körperschaft)
E22 Human-Made Objectphysisches, vom Menschen geschaffenes Objekt
E5 EventEreignis (Oberklasse für E65 Creation, E12 Production, …)
E52 Time-SpanZeitraum
E53 PlaceOrt
E55 TypeTypenbezeichnung (kontrollierte Vokabulare)
E73 Information ObjectInformationsträger (Text, Bild, Marke …)
PropertyBedeutung
P14 carried out byAkteur eines Ereignisses
P4 has time-spanZeitraum eines Ereignisses
P7 took place atOrt eines Ereignisses
P108 has producedErgebnis einer Produktion
P67 refers toBezug zu einer anderen Entität
P138 representsInformation stellt etwas dar

Implementation als RDF / OWL

Das CRM ist primär ein abstraktes Modell, wird aber meist als RDF/OWL-Ontologie eingesetzt. Daten werden als Tripel modelliert (Subjekt-Property-Objekt), Identifier sind URIs. Beispielfragment in Turtle:

@prefix crm: <http://www.cidoc-crm.org/cidoc-crm/> .

<obj/123>    a crm:E22_Human-Made_Object ;
             crm:P108i_was_produced_by <event/45> .

<event/45>   a crm:E12_Production ;
             crm:P14_carried_out_by <person/12> ;
             crm:P4_has_time-span <ts/45> .

<person/12>  a crm:E21_Person ;
             rdfs:label "Hans Georg Nägeli" .

Wichtige Erweiterungen

CIDOC CRM hat eine Reihe modularer Erweiterungen für spezifische Bereiche:

  • LRMoo (früher FRBRoo) — bibliografische Werke, Manifestationen, Items.
  • CRMsci — wissenschaftliche Beobachtungen und Messungen.
  • CRMarchaeo — archäologische Ausgrabungen und Kontexte.
  • CRMgeo — geografische und geometrische Aspekte.
  • CRMdig — digitale Objekte und Provenienz.
  • CRMtex — Textwissenschaftliche Aspekte.

Verhältnis zu anderen Standards

StandardCharakter
CIDOC CRMOntologie / konzeptionelles Modell
ISAD(G)archivische Verzeichnungs­regeln (Felder + Hierarchie)
EADXML-Schema für Findmittel
TEIXML-Schema für Texte
MODS / Dublin Corebibliografische Felder
LIDOXML für Museumsobjekte (CRM-konform)

CIDOC CRM ergänzt diese Standards: konkrete Daten (z. B. EAD-Findmittel oder TEI-Editionen) werden ins CRM-Modell projiziert, um quer über Bestände hinweg suchbar und verknüpfbar zu werden.

Anwendung in Anton

Unser Archivinformationssystem Anton nutzt CIDOC CRM als Leitmodell für den RDF-Export und ergänzt es selektiv um RiC-O. Die Ereignis-Zentriertheit kommt dabei entgegen: Antons Datenmodell kennt bereits Events (Objekt × Akteur × Ort × Datum × Typ), die sich weitgehend direkt auf die CRM-Eventklassen abbilden lassen — creationE12 Production, acquisitionE8 Acquisition, receptionE10 Transfer of Custody und so fort. Normdaten-Verweise (GND, VIAF, GeoNames, Wikidata) werden als owl:sameAs mitgeführt, kontrollierte Vokabulare als E55 Type / skos:Concept.

CRM dient hier als breit anschlussfähiges Modell für die Linked-Open-Data-Welt; wo RiC-O archivspezifisch genauer ist, wird es zusätzlich annotiert. Details im Spickzettel zu RiC und auf der Anton-Projektseite.

Werkzeuge

  • 3M Mapping Memory Manager — Werkzeug zum Mapping zwischen Quellschemata und CIDOC CRM.
  • ResearchSpace — Open-Source-Plattform für CRM-basierte Forschungsanwendungen.
  • Arches — Open-Source-Plattform für Kulturgut-Inventare; CRM-konform.
  • Erlangen-CRM/OWL — populäre OWL-Implementation des CRM.