PREMIS (Preservation Metadata: Implementation Strategies) ist der internationale Standard für die Beschreibung von Erhaltungs-Metadaten in der digitalen Langzeitarchivierung. Gepflegt wird er von der Library of Congress und dem PREMIS Editorial Committee. Aktuell ist Version 3.0 (2015, Erratum 2017) — eine grundlegende Überarbeitung gegenüber V2.
Während OAIS das abstrakte Konzept der Preservation Description Information (PDI) definiert, liefert PREMIS die konkrete, anwendbare Implementation: Welche Daten muss ich pro digitalem Objekt festhalten, damit es langfristig nutzbar bleibt? PREMIS ist neutral gegenüber Container-Formaten und kann in METS, in eigenen XML-Dokumenten oder als RDF/Linked-Data geführt werden.
Das Datenmodell — fünf Entitäten
PREMIS 3 unterscheidet fünf Entitäten:
| Entität | Bedeutung |
|---|---|
| Object | das digitale Objekt (Datei, Bitstream, Repräsentation) |
| Intellectual Entity | die intellektuelle Einheit hinter dem Objekt (ein Buch, eine Akte) |
| Event | jede Tätigkeit, die das Objekt betrifft (Ingest, Migration, Validation, Fixity-Check) |
| Agent | wer/was das Event ausgeführt hat (Person, Organisation, Software) |
| Rights | Rechtegrundlagen für die Erhaltung und Nutzung |
Die fünf Entitäten sind über Identifier (*Identifier) und Beziehungselemente (relationship) miteinander verknüpft.
Object — drei Spezialisierungen
Object hat drei Unterklassen, die unterschiedliche Granularitäten abbilden:
- File — eine konkrete Datei im Filesystem.
- Bitstream — ein Teil-Bytestrom innerhalb einer Datei (z. B. ein eingebettetes Bild).
- Representation — eine Sammlung von Files, die zusammen ein intellektuelles Objekt darstellen (z. B. alle Seiten eines digitalisierten Buchs, mit Strukturkarte).
Pro Object werden typischerweise erfasst:
objectIdentifier— eindeutige Identifikation (z. B. lokale ID + Persistent Identifier wie ARK).objectCharacteristics— Format (PUID), Grösse, Hash (fixity), Inhibitors.storage— wo wird das Objekt gespeichert.environment— Hard-/Software-Umgebung, falls für die Nutzung relevant.signature— kryptografische Signatur (optional).
Event — die Audit-Trail
Jede Bearbeitung eines Objekts wird als Event protokolliert:
| Element | Inhalt |
|---|---|
eventIdentifier | eindeutige Event-ID |
eventType | z. B. ingestion, format identification, fixity check, migration, validation |
eventDateTime | Zeitpunkt |
eventOutcomeInformation | Ergebnis (success / failure) mit Details |
linkingAgentIdentifier | wer hat es ausgeführt |
linkingObjectIdentifier | welches Objekt war betroffen |
Das Event-Log wird zur lückenlosen Provenienz des Objekts im Archiv — wesentlich für Vertrauenswürdigkeit nach ISO 16363/TRAC.
Beispiel als XML
<premis xmlns="http://www.loc.gov/premis/v3" version="3.0">
<object xsi:type="file">
<objectIdentifier>
<objectIdentifierType>local</objectIdentifierType>
<objectIdentifierValue>obj-2026-001</objectIdentifierValue>
</objectIdentifier>
<objectCharacteristics>
<fixity>
<messageDigestAlgorithm>SHA-256</messageDigestAlgorithm>
<messageDigest>e3b0c44298fc1c149afbf4c8996fb924…</messageDigest>
</fixity>
<size>1048576</size>
<format>
<formatRegistry>
<formatRegistryName>PRONOM</formatRegistryName>
<formatRegistryKey>fmt/19</formatRegistryKey>
</formatRegistry>
</format>
</objectCharacteristics>
<storage>
<contentLocation>
<contentLocationValue>file:///archive/2026/obj-2026-001.pdf</contentLocationValue>
</contentLocation>
</storage>
</object>
<event>
<eventIdentifier>…</eventIdentifier>
<eventType>ingestion</eventType>
<eventDateTime>2026-05-08T09:00:00Z</eventDateTime>
<eventOutcomeInformation>
<eventOutcome>success</eventOutcome>
</eventOutcomeInformation>
<linkingAgentIdentifier>…</linkingAgentIdentifier>
<linkingObjectIdentifier>…</linkingObjectIdentifier>
</event>
<agent>
<agentIdentifier>…</agentIdentifier>
<agentName>Anton 2026.4</agentName>
<agentType>software</agentType>
</agent>
</premis>
PREMIS in METS
In METS wird PREMIS typisch in amdSec/digiprovMD (Object-, Event-, Agent-Daten) und amdSec/rightsMD (Rights-Daten) eingebettet. Diese Kombination ist die de-facto-Implementation der OAIS-PDI in vielen produktiven Archiven.
Werkzeuge
- PREMIS Validator (LoC) — webbasierte Schema-Validierung.
- Archivematica — generiert PREMIS-Events automatisch entlang der OAIS-Pipeline.
- Rosetta (Ex Libris) — proprietäre OAIS-Plattform mit nativer PREMIS-Unterstützung.
Verhältnis zu anderen Standards
- OAIS — abstraktes Modell; PREMIS implementiert daraus die PDI.
- METS — Container, der PREMIS einbetten kann.
- Dublin Core — beschreibt die intellektuelle Ressource, nicht ihre Erhaltung — ergänzt PREMIS, ersetzt es nicht.
- PRONOM — liefert die PUIDs, die PREMIS in
formatRegistryreferenziert. - NARA Risk Levels — Risikobewertung von Formaten; lässt sich als Wert in PREMIS-
significantPropertiesführen.