PRONOM ist ein vom britischen Nationalarchiv (The National Archives, TNA) gepflegtes Online-Register von Dateiformaten und ihren Signaturen. Jeder Eintrag beschreibt ein Dateiformat technisch (Magic Bytes, Header-Strukturen, charakteristische Muster) und vergibt eine eindeutige Identifikation, den PUID (PRONOM Unique Identifier).

PRONOM ist seit 2002 öffentlich zugänglich und hat sich zum De-facto-Standard für die Identifikation von Dateiformaten in der digitalen Langzeitarchivierung entwickelt. OAIS-konforme Archive nutzen PUIDs, um die Formatzugehörigkeit eines Files dauerhaft und werkzeugunabhängig zu dokumentieren.

PUID-Schema

Ein PUID ist ein Namespace-Präfix mit einer fortlaufenden Nummer:

  • fmt/<n> — etablierte, formal beschriebene Formate (z. B. fmt/19 für PDF 1.4)
  • x-fmt/<n> — Formate aus älteren Erweiterungs-Sets, viele davon proprietär (z. B. x-fmt/111 für Microsoft Word 6.0/95)

Inhalt eines PRONOM-Eintrags

  • Formatname und -version
  • MIME-Type, Dateiendungen
  • Magic Numbers / Byte-Signaturen mit Position und Pattern
  • Beziehungen zu anderen Formaten (Vorgänger, Container, Untertyp)
  • Risikobewertung (z. B. proprietär, dokumentiert, weit verbreitet)
  • Externe Referenzen auf Spezifikationen

Werkzeuge

PRONOM ist eine Datenquelle, kein Werkzeug. Identifiziert wird mit Tools, die die PRONOM-Signaturen lesen:

  • DROID — das offizielle Werkzeug von TNA (Java)
  • Siegfried — schneller, in Go geschriebener CLI-Identifier (siehe Spickzettel)
  • FIDO — Python-Implementation der Open Preservation Foundation