PRONOM ist ein vom britischen Nationalarchiv (The National Archives, TNA) gepflegtes Online-Register von Dateiformaten und ihren Signaturen. Jeder Eintrag beschreibt ein Dateiformat technisch (Magic Bytes, Header-Strukturen, charakteristische Muster) und vergibt eine eindeutige Identifikation, den PUID (PRONOM Unique Identifier).
PRONOM ist seit 2002 öffentlich zugänglich und hat sich zum De-facto-Standard für die Identifikation von Dateiformaten in der digitalen Langzeitarchivierung entwickelt. OAIS-konforme Archive nutzen PUIDs, um die Formatzugehörigkeit eines Files dauerhaft und werkzeugunabhängig zu dokumentieren.
PUID-Schema
Ein PUID ist ein Namespace-Präfix mit einer fortlaufenden Nummer:
fmt/<n>— etablierte, formal beschriebene Formate (z. B.fmt/19für PDF 1.4)x-fmt/<n>— Formate aus älteren Erweiterungs-Sets, viele davon proprietär (z. B.x-fmt/111für Microsoft Word 6.0/95)
Inhalt eines PRONOM-Eintrags
- Formatname und -version
- MIME-Type, Dateiendungen
- Magic Numbers / Byte-Signaturen mit Position und Pattern
- Beziehungen zu anderen Formaten (Vorgänger, Container, Untertyp)
- Risikobewertung (z. B. proprietär, dokumentiert, weit verbreitet)
- Externe Referenzen auf Spezifikationen
Werkzeuge
PRONOM ist eine Datenquelle, kein Werkzeug. Identifiziert wird mit Tools, die die PRONOM-Signaturen lesen:
- DROID — das offizielle Werkzeug von TNA (Java)
- Siegfried — schneller, in Go geschriebener CLI-Identifier (siehe Spickzettel)
- FIDO — Python-Implementation der Open Preservation Foundation