SIP-Import in Anton¶
Übersicht¶
Der SIP-Import ermöglicht es, Archivpakete (SIPs - Submission Information Packages) automatisch in Anton zu importieren. Dabei werden alle Dokumente, Metadaten und die Ordnerstruktur übernommen und sicher in der INGE-Cloud gespeichert.
Der Import-Prozess ist in drei Hauptphasen unterteilt, die den Tabs in der Anton-Oberfläche entsprechen:
- Upload - SIP-Datei hochladen
- Validierung - Datei prüfen und validieren
- Ingest - Import durchführen und Dokumente verarbeiten
Upload¶
- Die maximale Dateigrösse ist von der Systemkonfiguration abhängig. Probleme bitte dem Administrator melden.
Validierung¶
Automatische Dateiprüfung¶
Was das System prüft¶
- Vollständigkeit der ZIP-Datei
- Vorhandensein der metadata.xml nach eCH-0160 Standard
- Integrität aller Dokumentdateien (MD5-Checksummen)
- Korrekte Ordnerstruktur und Hierarchie (insbesondere, ob die Root-Dossiers des SIPs in die bestehende Archivstruktur eingehängt werden können)
- Eindeutigkeit (bereits importierte SIPs werden erkannt)
Was Sie sehen¶
- Detaillierter Validierungsbericht
- Grüne Häkchen für erfolgreiche Prüfungen
- Rote Fehlermeldungen mit konkreten Hinweisen
- Status «Validierung bestanden» oder «Validierung fehlgeschlagen»
Mögliche Probleme¶
- Parent für Root-Dossiers können nicht gefunden werden
- Beschädigte oder unvollständige ZIP-Datei
- Fehlende oder ungültige metadata.xml
- Defekte Dokumentdateien
- Bereits importierte SIP-Datei
Ingest¶
SIP-Import Workflow¶
flowchart TD
A[Systemprüfung INGE] --> B{INGE-Cloud verfügbar?}
B -->|Nein| C[Import abbrechen]
B -->|Ja| D[DB-Backup erstellen]
D --> E[Ordnerstruktur analysieren]
E --> F{Import-Modus?}
F -->|Standard SIP| G[XML-Metadaten verarbeiten]
F -->|Directory Import| H[Dateisystem scannen]
G --> I[Antonimport aus XML erstellen]
H --> J[Antonimport aus Ordnern erstellen]
I --> K[Phase 1: Datenbankimport]
J --> K
K --> L[Phase 2: Asynchrone Verarbeitung ]
L --> M[Pfade aktualisieren]
M --> N[Signaturen setzen]
N --> O[Vorschaubilder erstellen]
O --> P[Phase 3: Upload zu INGE-Cloud]
P --> Q{Alle Dateien hochgeladen?}
Q -->|Nein| R[Weitere Verarbeitung]
Q -->|Ja| S[Volltext indexieren]
R --> Q
S --> T[Import bestätigen]
T --> U[E-Mail-Benachrichtigung]
U --> V[Import abgeschlossen]
style A fill:#e3f2fd
style V fill:#e8f5e8
style C fill:#ffebee
Wenn der Import fehl schlägt
- Im Akzessionsarchiv den SIP Datensatz aufrufen
- Datenbank aus Backup wiederherstellen (Dateien werden mit Inge/Dimag synchronisiert)
Import-Modi¶
Standard SIP-Import¶
Die Einstellung import-dossier-from-directory
muss leer sein oder auf 0 oder false gesetzt werden.
Funktionsweise¶
- Ordnerstruktur wird aus den XML-Metadaten erstellt (Dossier/Dokumentstruktur)
- Jedes Dossier, jede Mappe und jedes Dokument ist in der metadata.xml definiert
- Hierarchie basiert auf der XML-Struktur der
<ablieferung>
(parent-child Beziehungen)
Vorteile¶
- Vollständige Metadaten aus dem Ablieferungssystem
- Exakte Übernahme der logischen Struktur des SIP
- Informationen zu Entstehungskontext und Provenienz aus XML
Directory Import¶
Im metadata.xml
werden zwei Strukturen präsentiert:
1) Die Ablagestruktur der Dateien im Dateisystem (Ordner/Dateien) im Ordner content
entspricht dem <inhaltsverzeichnis>
im metadata.xml
2) Das Element ablieferung
enthält die Verortung in der Gesamthierarchie (Elemente <ordnungssystem>
, <ordnungssystemposition>
) sowie die logische Struktur des eigentlichen Inhalts der Ablieferung in Dossiers (dossier>
) und Dokumente (<dokument>
) (wobei die Dokumente, einen Verweis auf Dateien enthalten können).
Die beiden Strkturen können sich entsprechen, müssen aber nicht. In der Praxis gibt es Dossiers, deren Ablagestruktur erheblich von der logischen Struktur abweicht. Deshalb kann es sinnvoll sein, die Ablagestruktur und nicht die eigentlich vorgesehene SIP Struktur zu übernehmen.
Die Einstellung import-dossier-from-directory
muss auf 1 oder true gesetzt werden.
Wichtig
Der Directory Import funktioniert nur mit einem Dossier pro SIP.
Funktionsweise¶
Die Hierarchie wird aus dem Dateisystem der SIP-Datei erstellt (Ordner: content
, das entspricht der Ordner-Datei-Struktur im metadata.xml, die logische Struktur der Dossiers und Dokumente wird ignoriert. Auch die Metadaten können nicht importiert werden.)
- Der Root-Ordner im content Ordner wird mit dem Dossier des SIPs gleichgesetzt.
- Datei-Metadaten werden aus den Dateieigenschaften generiert (soweit möglich).
- XML-Metadaten werden nur für das Root-Dossier verwendet.
Dauer¶
Beispiel: Der Import von 100 Datensätze mit 100 Dateien dauert ca. 10 Minuten.
Während Phase 1 reagiert die Seite nicht und der Browser darf nicht geschlossen werden. Diese Phase dauert im Beispiel ca. 2 Minuten.
Phase 2 läuft asynchron, aber im Browser ist immer noch nicht zu erkennen (nochmal 2 Minuten).
Anschliessend lässt sich verfolgen, wie das System Phase 3 abarbeitet.
Letzte Aktualisierung: 2025-08-05