DA NRW - ein Lösungsverbund

DA NRW - ein Lösungsverbund

Um den bei aller vorhandenen Gemeinsamkeit unterschiedlichen Anforderungen der beteiligten Servicenehmer gerecht zu werden, soll im Digitalen Archiv Nordrhein-Westfalen (DA NRW) nicht mit einer Software, sondern mit einer Verbundlösung gearbeitet werden. Innerhalb des DA NRW stehen daher die DA NRW Software Suite (kurz DNS) und die Digital Preservation Solution (kurz DiPS.kommunal) zur Verfügung.

Digital Preservation Solution (DiPS.kommunal)

DiPS.kommunal ist eine elektronische Langzeitarchivlösung für Kommunalarchive in NRW, betrieben durch den Landschaftsverband Westfalen-Lippe (LWL) und die Stadt Köln.
DiPS.kommunal orientiert seine Arbeitsschritte an bewährten archivischen Arbeitsprozessen und bindet die bestehende Erschließungssoftware (z. B. ACTApro / AUGIAS / FAUST) in eine OAIS-konforme Gesamtarchitektur ein:

  • Akzession / Lieferung
  • Bewertung
  • technische Bearbeitung und Formierung von Einheiten
  • Magazinierung
  • Erschließung
  • Nutzung / Veröffentlichung

Die Entwicklergemeinschaft, bestehend aus der LWL.IT Service Abteilung, dem LWL-Archivamt für Westfalen, dem Amt für Informationsverarbeitung der Stadt Köln und dem Historischen Archiv der Stadt Köln, betreibt DiPS.kommunal als Verbundlösung in ihren jeweiligen Rechenzentren und bietet umfassende Beratung und Support. Die revisionssichere Datenspeicherung erfolgt in einer ausfallsicheren, redundant ausgelegten IT-Infrastruktur.

Schon jetzt unterstützt DiPS.kommunal die Aktenübernahme auf Basis nationaler Standards wie XDomea 2.2 und zukünftig auch XPersonenstandsregister. Wo immer möglich, werden standardisierte und einfach konfigurierbare XML-basierte monodirektionale Schnittstellen eingesetzt. Dies gilt für den sogenannten Ingest (also die Übernahmewege ins Langzeitarchiv), aber auch für die spätere Nutzung durch Archivmitarbeiterinnen und -mitarbeiter, im Lesesaalbetrieb und über das Internet.

DiPS.kommunal dokumentiert alle mit dem Archivgut im Übernahmevorgang durchgeführten Prozessschritte (wie z.B. die Konvertierung von Dateien in langzeitstabile Formate) und auch die Erhaltungsmaßnahmen im elektronischen Langzeitarchiv (z.B. Migrationen von nicht mehr unterstützten Dateiformaten). Für eine langfristige Nachvollziehbarkeit bleiben Ursprungs- und Konvertierungsformate - die sogenannten Repräsentationen - im System erhalten.

DiPS.kommunal setzt auf Modularität im Dateneingang (Ingest) und der Datenverarbeitung (z. B. Formaterkennung, -validierung, Konvertierung), aber auch zwischen Langzeitarchiv und nachgelagerter Erschließungssoftware. Hierdurch können aktuellere und zusätzliche Module und Softwarekomponenten eingebunden werden, ohne das Gesamtsystem wechseln zu müssen.

DiPS.kommunal unterstützt viele Arten von potentiell vorkommendem elektronischem Archivgut:

  • Strukturierte Unterlagen aus eAkten-bildenden Systemen ("DMS" und entsprechenden Fachverfahren)
  • Ordnerbasierte Dateiablagen (File-Systeme)
  • Datenbanken
  • Video- und Audio-Überlieferung (einschließlich Management von Erhaltungs- und Nutzungsrepräsentationen)

In DiPS.kommunal gibt es klare Regeln für die Archivformate: Sie sollen nach Möglichkeit, wie zum Beispiel PDF/A, ISO-normiert und langzeitstabil sein!

DiPS.kommunal gewährleistet eine quellenkritisch saubere, systemische Trennung von Registraturbildner- und Erschließungsinformationen: Nur die Primär- und Metadaten der abgebenden Dienststellen werden Teil des Archivinformationspaketes, während die archivische Verzeichnung separat in der Datenbank der Erschließungssoftware (z. B. ACTApro / AUGIAS / FAUST) gespeichert wird. Das ermöglicht dort die Korrektur von Inhalt und Orthografie oder die Anpassung der Schutzfristen, ohne dafür das entsprechende Archivinformationspaket verändern zu müssen. Über eine dauerhaft stabile technische Kennung sind die Informationen zu den Archivinformationspaketen des Langzeitarchivs mit den Erschließungsinformationen verknüpft.

DiPS.kommunal speichert seine Archivinformationspakete in offen dokumentierten, nicht-proprietären TAR-Containern. Die Metadaten werden in je einer menschen- und maschinenlesbaren AIP.xml bei den Primärobjekten abgelegt. Auf diese Weise wird eine größtmögliche Systemunabhängigkeit in der Weiterverarbeitung und eine zukunftssichere Lesbarkeit der Daten gewährleistet.

Die DiPS.kommunal-Betreiber verwenden hochwertige revisionssichere Speichersysteme, die eine ausreichende Redundanz sicherstellen und die für eine genügende Performanz auch bei großen Lieferungen sorgen. Dabei besteht eine durchgängige Mandantentrennung bei der Verarbeitung und Speicherung. Diese Maßnahme sorgt für eine Trennung des Archivguts nach den teilnehmenden Kommunen und vereinfacht Migrations- und Exitstrategien.

DiPS.kommunal ist die mandantenfähige Weiterentwicklung der Langzeitarchivlösung DiPS. DiPS wurde ursprünglich durch die Firmen SER Solutions Deutschland GmbH und HP für das Bundesarchiv und das Stadtarchiv Stuttgart entwickelt. Inzwischen ist DiPS auch im Historischen Archiv der Stadt Köln, im LWL-Archivamt für Westfalen und in den Landesarchiven NRW (für den Ingest unter der Bezeichnung ADD+) und Rheinland-Pfalz im Einsatz.

Für das Rheinland:

Fachliche Ansprechpartnerin:
Dr. Julia Krämer-Riedel
Historisches Archiv der Stadt Köln
Heumarkt 14
50667 Köln
Telefon: 0221/221-24463
E-Mail: julia.kraemer-riedel(at)stadt-koeln.de

Technischer Ansprechpartner:
Thorsten Preuss
Stadt Köln – Amt für Informationsverarbeitung
120/3 CSCW-Systeme
Enggasse 2
50668 Köln
Telefon: 0221/221-23453
E-Mail: thorsten.preuss(at)stadt-koeln.de

Für Westfalen-Lippe:

Fachlicher Ansprechpartner:
Tobias Schröter-Karin
Landschaftsverband Westfalen-Lippe (LWL)
LWL-Archivamt für Westfalen
Jahnstr. 26
48147 Münster
Telefon: 0251/591-3888
E-Mail: Tobias.Schroeter-Karin(at)lwl.org 

Technische Ansprechpartnerin:
Dr. Juliane Brink
Landschaftsverband Westfalen-Lippe (LWL)
DMS-CC der LWL.IT Service Abteilung
Warendorfer Straße 22
48145 Münster
Telefon: 0251/591-6717
E-Mail: juliane.brink(at)lwl.org

DA NRW Software Suite (DNS)

Die „DA NRW Software Suite (DNS)“ ist eine frei verfügbare, quelloffene Softwarelösung zur voll automatisierten Langzeitarchivierung digitaler Inhalte. Sie ist geeignet für alle Gedächtniseinrichtungen im kulturellen Umfeld.

Im Kern basiert das Konzept der DNS auf einer verteilten, kooperativen und redundanten Speicherung in einer OAIS-konformen Gesamtarchitektur. Dies schließt Werkzeuge wie die Konvertierung nicht langzeitarchivierungsfähiger Formate in geeignetere Formate ebenso wie die einfache Anbindung einer „Technology Watch” ein.

Basis dieses Systems ist ein Speicherverbund prinzipiell eigenständiger Repositorien, die bei mehreren Servicegebern an unterschiedlichen Orten betrieben werden. Die Lösung ist so konzipiert, dass die in das DA NRW einliefernden Institutionen digitale Inhalte und Metadaten auf sogenannten Knoten, auf denen DNS läuft, abgeben können. Der Knoten übernimmt dann die Verwaltung der eingelieferten Inhalte und führt eine Reihe von Prozessen durch, die sowohl der Bitstream-Preservation, also dem Erhalt der digitalen Informationen als solcher, als auch der Erhaltung („Preservation Planning“) des Informationsgehaltes der Archivalien dienen.

Regelmäßige Formatmigrationen bringen die Inhalte auf den jeweils neuesten Stand der Technik. Zudem ist DNS darauf ausgelegt, auf geographisch distinkten Lokationen die Inhalte gegeneinander zu spiegeln, abzugleichen und regelmäßig auf Integrität zu prüfen. Zusammengenommen sorgt dieses Vorgehen für den dauerhaften Erhalt digitaler Inhalte.

Zur Einlieferung in DNS steht als Werkzeug ein SIP (Submission Information Package)-Builder mit graphischer Oberfläche (alternativ als Kommandozeilen-Werkzeug) zur Verfügung. Er ermöglicht es dem Einlieferer, Daten mit Merkmalen zu versehen, die eine Verwaltung im DA NRW sicherstellen. Dazu gehören Angaben zur Migration, zu (Nutzungs-)Rechten und zur Publikation in Portalen. Sofern Anforderungen bestehen, die über die Möglichkeiten des SIP-Builders hinausgehen, können Kultureinrichtungen auch eigene Werkzeuge unter Berücksichtigung der Spezifikation für eine Einlieferung im DA NRW einsetzen.

Bei der Einlieferung erfolgt derzeit die Formaterkennung und Formatvalidierung mit den Werkzeugen JHOVE und FIDO. Liegt die Erlaubnis des Einlieferers vor und kann das eingelieferte Format interpretiert werden, werden eingelieferte Daten in ein archivgeeignetes, „unterstütztes Format“ konvertiert, soweit sie nicht bereits in einem solchen Format eingeliefert wurden. Die Daten bleiben daneben in jedem Fall auch im eingelieferten Format erhalten und werden in dieser Form zusammen mit dem unterstützten Format in Archiv-Informations-Paketen (AIP) gespeichert.

Die Speicherung erfolgt redundant auf mindestens drei hochsicheren Knoten im DA NRW. Akzeptiert werden alle Arten von Daten aus einem Quellverzeichnis, was den physischen Erhalt der Datenobjekte (Bitstream-Preservation) für alle Daten ermöglicht. Die Speicherung erfolgt so, dass die Daten anschließend nicht mehr gelöscht, überschrieben oder verändert werden können sowie mit der Möglichkeit des Retrievals erzeugter AIPs.

Die DNS-Software unterscheidet bei den unterstützten Formaten nach akzeptierten und verstandenen.

Zu den grundsätzlich einlieferbaren Formaten zählen:

  • Text: PDF, PDF/A, Doc, Docx
  • Bild: TIFF, JPEG, JPEG 2000, BMP, PNG, GIF
  • Ton: PCM-Wave, MP3
  • Video: AVI, MXF, MPEG4**

Die genauen Formate, welche im DNS aktuell verstanden und verarbeitet werden können, finden Sie hier:

https://github.com/da-nrw/DNSCore/blob/master/ContentBroker/src/main/markdown/operations_format_conversion_current_configuration.de.md

Zur einfachen Erstellung von abgabefähigen Paketen (SIP) in das DNS steht die folgende Anwendung für Sie zum Herunterladen bereit:

SIP-Builder, https://www.danrw.de/dns/software/SipBuilder.zip. Bitte verwenden Sie stets die aktuellste Version des SIP-Builders (Build #1888).

Aktuelle Informationen zu Verbesserungen des Build #1888 zum vorherigen Entwicklungsstand der DNS („Release Notes“) können Sie hier einsehen:
https://www.danrw.de/dns/docs/release/1888/ReleaseNotes-DNS-b1856-b1888.pdf.

Die ReleaseNotes der vorherigen Versionen finden Sie hier :
Build #1856 https://www.danrw.de/dns/docs/release/1805-1856/ReleaseNotes-DNS-b1805-b1856.pdf
Build #1805 https://www.danrw.de/dns/docs/release/1643-1805/ReleaseNotes-DNS-b1643-b1805.pdf

Weitere Informationen rund um die Software DNS können unter github.com/da-nrw/DNSCore abgerufen werden.

DNS wurde in der Projektphase im Auftrag des Ministeriums für Familie, Kinder, Jugend, Kultur und Sport des Landes NRW als Forschungsprojekt von der Historisch- Kulturwissenschaftlichen Informationsverarbeitung (HKI) der Universität zu Köln entwickelt. Inzwischen hat LVR-InfoKom die Wartung und Weiterentwicklung der Software übernommen.

DNS im Überblick:

  • OAIS-konformes spartenunabhängiges Langzeitarchiv
  • Synchronisierung des über mindestens drei geografische Standorte
  • DNS ist eine Open Source Software

Informationen zur DA NRW Software Suite (kurz DNS) finden Sie auch unter:
https://github.com/da-nrw/DNSCore/blob/master/ContentBroker/src/main/markdown/documentation.de.md.

Maike Lücke
LVR-InfoKom
Kundenmanagement
Ottoplatz 2
50679 Köln
Telefon: 0221/809-2171
Fax: 0221/8284-2518
E-Mail: Maike.Luecke(at)lvr.de

Beate van Kempen
LVR-InfoKom
Produktmanagement
Ottoplatz 2
50679 Köln
Telefon: 0221/809-3604
E-Mail: Beate.vanKempen(at)lvr.de