Wie PDF durchsuchbar und DSGVO-konform gemacht werden können

“Going Paperless” ist ein häufig angetroffenes Buzzword in der Zeit der Digitalen Transformation. Ein dabei wichtiger Aspekt ist die Archivierung. Im Zuge der fortschreitenden Digitalisierung stellen sich Organisationen also unter anderem die Frage, inwieweit Dokumente digital archiviert werden können und ob auf eine physische Archivierung gänzlich verzichtet werden kann.

Bei der Archivierung stellen sich aber noch andere Fragen. Etwa wie es möglich ist, dass digitale Dokumente trotzdem den gesetzlichen Bestimmungen entsprechen. Zudem sollen die Dokumente in elektronischer Form durchsuchbar sein, sodass Informationen mit geringstmöglichem Aufwand konsultiert und abgerufen werden können. Welche Dateiformate sich für die Archivierung eignen und wie diese sowohl durchsuchbar als auch Datenschutz-konform gemacht werden können, will ich Ihnen nachstehend näher bringen.

PDF/A: Standard für die elektronische Archivierung von Geschäftsdokumenten

Am besten für die Archivierung geeignet ist das PDF/A Dateiformat, wobei das A auch sinngemäss für Archivierung steht. Es ist ein ISO-standardisiertes Format, dass extra für die Archivierung von digitalen Dokumenten entwickelt wurde. Das PDF/A wurde 2005 veröffentlicht und seitdem sind einige Erweiterungen des Standards entwickelt und veröffentlicht worden. Es gibt mittlerweile drei Normen, wobei die Norm PDF/A-4 noch im Jahr 2020 kommen sollte. Die Normen PDF/A-1 bis PDF/A-3 haben jeweils noch unterschiedliche Konformitätsebenen. Welche Eigenschaften die jeweiligen Standards und ihre Konformitätsebenen haben, können Sie hier nachlesen.

Was PDF/A zum besten Dateiformat für Archievierungszwecke macht

Verglichen mit dem normalen PDF-Format, bietet das PDF/A Format einige wesentliche Vorteile, die es zu einer besseren Lösung für die Langzeitarchivierung von elektronischen Dokumenten macht. PDF/A ist nicht umsonst ein weit verbreitetes Dateiformat, das in vielen Branchen zur Archivierung eingesetzt wird.

Wie eingangs erwähnt, ist es wichtig, dass archivierte Dokumente durchsuchbar sind. Nur so können Informationen schnell abgerufen werden, ohne dass ein Vielfaches an manueller Arbeit für das Aufstöbern des passenden Dokuments aufgewendet werden muss. Auch die mit OCR extrahierten Daten sind weiterhin durchsuchbar. Das heisst, sowohl der mit OCR extrahierte Text, als auch jegliche eingescannten Bilder werden im PDF/A Format gespeichert und sind danach durchsuchbar.

Wenn ein papierloses Unternehmen angestrebt wird, dann muss natürlich auch sichergestellt werden, dass die digitalen Dokumente nicht zu viel Speicherplatz brauchen. Das ist ein weiteres Plus von PDF-Dateien. Denn diese können nämlich dank einer guten Datenstruktur und sehr effizienten Komprimierungsalgorithmen ziemlich kompakt gemacht werden. Wenn Sie mehr darüber in Erfahrung bringen wollen, lesen Sie am besten hier weiter.

Wie zuvor angedeutet, gibt es die Normen PDF/A-1 bis PDF/A-3, die über die Jahre entwickelt wurden. Diese sind aber alle gültig und miteinander kompatibel. Sprich, wenn vor einigen Jahren noch die PDF/A-2 Norm für die Archivierung verwendet und jetzt auf PDF/A-3 gewechselt wurde, dann müssen die zuvor archivierten Dokumente nicht migriert werden. Das ISO-Komitee kann keine ältere Norm zurückziehen, was bedeutet, dass Sie keine Daten verlieren oder sie allenfalls inkompatibel werden. Mit PDF/A haben Sie also eine sichere und immer gültig bleibende Lösung für die Archivierung.

PDF/A bietet in Kombination mit digitalen Signaturen zudem optimale Rechtssicherheit. Diese Kombination sorgt dafür, dass PDF/A-Dokumente nicht verändert werden können und ist deshalb bestens für die Langzeitarchivierung geeignet.

Datenschutzkonformität dank PDF/A

Die im Mai 2018 veröffentlichte Datenschutz-Grundverordnung (DSGVO) ist eine Verordnung der Europäischen Union (EU), mit der die Regeln zur Verarbeitung personenbezogener Daten vereinheitlicht werden sollen. Welche Bestimmungen genau die DSGVO ausmachen, erfahren Sie hier.

Da die Schweiz kein Teil der EU ist, kommt die DSGVO nur zum Zug, wenn Sie personenbezogene Daten von natürlichen Personen verarbeiten, die sich in der EU befinden, und falls die Verarbeitung dazu dient:

  • diesen Personen Waren oder Dienstleistungen anzubieten (gegen Bezahlung oder unentgeltlich), oder
  • das Verhalten dieser Personen zu verfolgen, sofern dieses Verhalten in den Mitgliedstaaten der EU erfolgt

Dank dem PDF/A-Format sollte dies aber kein Problem sein. Wenn Sie möglicherweise schon Daten gespeichert haben und es nicht wissen, kann dies problematisch sein, wenn diese nicht digital archiviert wurden und demzufolge nicht elektronisch durchsuchbar sind.

Deswegen ist es ja eben so wichtig, dass Sie durchsuchbare PDF/A-Dateien zur Archivierung verwenden, weil diese einfach mit automatisierter Anonymisierung kombiniert werden können. So sollte die DSGVO für Sie kein Problem mehr darstellen und Ihre Daten können auch in Zukunft problemlos Datenschutz-konform archiviert werden.

Wie PDF/A-Dateien erstellt werden können

Bei all den Vorteilen bleibt nun nur noch die Frage, wie denn eine PDF/A-Datei erstellt werden kann. Natürlich geht das mit Microsoft Word, wenn nur wenige Dateien erstellt werden müssen. Bei einer grossen Anzahl wird das aber schnell aufwändig und komplex.

Parashift kann diesen Prozess für Sie übernehmen und jegliche Bilder, Scans und PDFs in durchsuchbare und Datenschutz-konforme PDF/A-Dateien konvertieren, die bestens für Archivierungszwecke geeignet sind. Dies natürlich lediglich in Ergänzung zum eigentlichen Kerngeschäft: Der strukturierten Datenextraktion.

Wie das genau funktioniert, versuchen Sie am besten gleich selbst. Dazu registrieren Sie sich am besten über nachstehenden Banner, wo Sie anschliessend ohne jegliche Konfiguration Dokumente aus dem Einkauf wie etwa Bestellungen, Lieferscheine, Rechnungen, etc. direkt verarbeiten können. Und sollten Sie ergänzende Fragen haben, dann zögern Sie nicht, uns zu kontaktieren.

Related Posts