PREMIS (Preservation Metadata: Implementation Strategies) ist der internationale Standard für die Beschreibung von Erhaltungs-Metadaten in der digitalen Langzeitarchivierung. Gepflegt wird er von der Library of Congress und dem PREMIS Editorial Committee. Aktuell ist Version 3.0 (2015, Erratum 2017) — eine grundlegende Überarbeitung gegenüber V2.

Während OAIS das abstrakte Konzept der Preservation Description Information (PDI) definiert, liefert PREMIS die konkrete, anwendbare Implementation: Welche Daten muss ich pro digitalem Objekt festhalten, damit es langfristig nutzbar bleibt? PREMIS ist neutral gegenüber Container-Formaten und kann in METS, in eigenen XML-Dokumenten oder als RDF/Linked-Data geführt werden.

Das Datenmodell — fünf Entitäten

PREMIS 3 unterscheidet fünf Entitäten:

EntitätBedeutung
Objectdas digitale Objekt (Datei, Bitstream, Repräsentation)
Intellectual Entitydie intellektuelle Einheit hinter dem Objekt (ein Buch, eine Akte)
Eventjede Tätigkeit, die das Objekt betrifft (Ingest, Migration, Validation, Fixity-Check)
Agentwer/was das Event ausgeführt hat (Person, Organisation, Software)
RightsRechtegrundlagen für die Erhaltung und Nutzung

Die fünf Entitäten sind über Identifier (*Identifier) und Beziehungs­elemente (relationship) miteinander verknüpft.

Object — drei Spezialisierungen

Object hat drei Unterklassen, die unterschiedliche Granularitäten abbilden:

  • File — eine konkrete Datei im Filesystem.
  • Bitstream — ein Teil-Bytestrom innerhalb einer Datei (z. B. ein eingebettetes Bild).
  • Representation — eine Sammlung von Files, die zusammen ein intellektuelles Objekt darstellen (z. B. alle Seiten eines digitalisierten Buchs, mit Strukturkarte).

Pro Object werden typischerweise erfasst:

  • objectIdentifier — eindeutige Identifikation (z. B. lokale ID + Persistent Identifier wie ARK).
  • objectCharacteristics — Format (PUID), Grösse, Hash (fixity), Inhibitors.
  • storage — wo wird das Objekt gespeichert.
  • environment — Hard-/Software-Umgebung, falls für die Nutzung relevant.
  • signature — kryptografische Signatur (optional).

Event — die Audit-Trail

Jede Bearbeitung eines Objekts wird als Event protokolliert:

ElementInhalt
eventIdentifiereindeutige Event-ID
eventTypez. B. ingestion, format identification, fixity check, migration, validation
eventDateTimeZeitpunkt
eventOutcomeInformationErgebnis (success / failure) mit Details
linkingAgentIdentifierwer hat es ausgeführt
linkingObjectIdentifierwelches Objekt war betroffen

Das Event-Log wird zur lückenlosen Provenienz des Objekts im Archiv — wesentlich für Vertrauenswürdigkeit nach ISO 16363/TRAC.

Beispiel als XML

<premis xmlns="http://www.loc.gov/premis/v3" version="3.0">
  <object xsi:type="file">
    <objectIdentifier>
      <objectIdentifierType>local</objectIdentifierType>
      <objectIdentifierValue>obj-2026-001</objectIdentifierValue>
    </objectIdentifier>
    <objectCharacteristics>
      <fixity>
        <messageDigestAlgorithm>SHA-256</messageDigestAlgorithm>
        <messageDigest>e3b0c44298fc1c149afbf4c8996fb924…</messageDigest>
      </fixity>
      <size>1048576</size>
      <format>
        <formatRegistry>
          <formatRegistryName>PRONOM</formatRegistryName>
          <formatRegistryKey>fmt/19</formatRegistryKey>
        </formatRegistry>
      </format>
    </objectCharacteristics>
    <storage>
      <contentLocation>
        <contentLocationValue>file:///archive/2026/obj-2026-001.pdf</contentLocationValue>
      </contentLocation>
    </storage>
  </object>

  <event>
    <eventIdentifier>…</eventIdentifier>
    <eventType>ingestion</eventType>
    <eventDateTime>2026-05-08T09:00:00Z</eventDateTime>
    <eventOutcomeInformation>
      <eventOutcome>success</eventOutcome>
    </eventOutcomeInformation>
    <linkingAgentIdentifier>…</linkingAgentIdentifier>
    <linkingObjectIdentifier>…</linkingObjectIdentifier>
  </event>

  <agent>
    <agentIdentifier>…</agentIdentifier>
    <agentName>Anton 2026.4</agentName>
    <agentType>software</agentType>
  </agent>
</premis>

PREMIS in METS

In METS wird PREMIS typisch in amdSec/digiprovMD (Object-, Event-, Agent-Daten) und amdSec/rightsMD (Rights-Daten) eingebettet. Diese Kombination ist die de-facto-Implementation der OAIS-PDI in vielen produktiven Archiven.

Werkzeuge

  • PREMIS Validator (LoC) — webbasierte Schema-Validierung.
  • Archivematica — generiert PREMIS-Events automatisch entlang der OAIS-Pipeline.
  • Rosetta (Ex Libris) — proprietäre OAIS-Plattform mit nativer PREMIS-Unterstützung.

Verhältnis zu anderen Standards

  • OAIS — abstraktes Modell; PREMIS implementiert daraus die PDI.
  • METS — Container, der PREMIS einbetten kann.
  • Dublin Core — beschreibt die intellektuelle Ressource, nicht ihre Erhaltung — ergänzt PREMIS, ersetzt es nicht.
  • PRONOM — liefert die PUIDs, die PREMIS in formatRegistry referenziert.
  • NARA Risk Levels — Risikobewertung von Formaten; lässt sich als Wert in PREMIS-significantProperties führen.