Was versteckt PDF



PDF-Dateien enthalten viele Informationen. Die meisten werden für die gleiche Visualisierung des Dokuments auf verschiedenen Plattformen verwendet. Es gibt aber auch viele Metadaten: Datum und Uhrzeit der Erstellung und Bearbeitung, welche Anwendung verwendet wurde, das Thema des Dokuments, Titel, Autor und vieles mehr. Dies ist ein Standardsatz von Metadaten, und es gibt Möglichkeiten, benutzerdefinierte Metadaten in eine PDF-Datei einzufügen: versteckte Kommentare in der Mitte der Datei. In diesem Artikel werden einige Formen von Metadaten vorgestellt und gezeigt, wo sie gesucht werden müssen.

Informationsmetadaten


Ab PDF 1.0 gibt es einen standardisierten Satz von Werten, die dem Dokument weiter hinzugefügt werden können. Dateimanager verwenden diese Werte, um die Dokumentensuche zu verbessern. Dazu gehören:

  • Der Autor
  • Erstellungsdatum
  • Schöpfer
  • Produzent

In PDF 1.1 wurde dieser Satz um zusätzliche Daten erweitert, die beim Auffinden von Dokumenten helfen:

  • Titel
  • Thema
  • Stichworte
  • Bearbeitungsdatum (ModDate)

Genau genommen sind diese Informationen nicht wirklich verborgen, da Sie sie in vielen Anwendungen anzeigen können. Aber es wird nicht der Öffentlichkeit gezeigt. Wenn Sie sich Sorgen um die Sicherheit machen, sollten Sie sich auf jeden Fall sorgfältig auf diese Informationen verlassen, da sie später bearbeitet werden können. Da Metadaten möglicherweise getrennt vom angezeigten Inhalt aktualisiert werden, bedeutet dies, dass der Dateimanager und die Metadaten die Änderungen anzeigen und sich der Inhalt möglicherweise nicht ändert.



Zusätzliche Metadaten


Der PDF-Standard unterstützt jetzt noch mehr Metadaten. Anstelle eines kleinen Satzes von Standardwerten können Sie einen ganzen Informationsstrom im XMP- Format speichern. Dadurch können dort beliebige Datentypen eingebettet werden. Auch hier werden sie nicht angezeigt, können aber vom Dateimanager analysiert werden.

Der XMP-Stream kann codiert werden, sodass er nicht immer von Personen gelesen wird. Viele Anwendungen können diese Informationen jedoch lesen und bearbeiten. Hier ist ein Beispiel dafür, wie XMP in einem für Menschen lesbaren Format aussieht:

<xmp:CreateDate>1851-08-18</xmp:CreateDate> <xmp:CreatorTool>Ink and Paper</xmp:CreatorTool> <dc:creator> <rdf:Seq> <rdf:li>Nick Winder</rdf:li> </rdf:Seq> </dc:creator> <dc:title> <rdf:Alt> <rdf:li xml:lang="x-default">My Amazing PDF</rdf:li> </rdf:Alt> </dc:title> 

Es ist leicht zu verstehen, dass diese Informationen von unschätzbarem Wert sind, wenn Sie versuchen, den Verlauf eines Dokuments zu bestimmen oder andere Informationen einzubetten. PSPDFKit für iOS und Android unterstützt das Lesen und Bearbeiten von Metadaten.

Objektmetadaten


Metadatenströme sind nicht auf Dokumente beschränkt. Metadaten können auch jedem Objekt in einem Dokument zugewiesen werden. Zum Beispiel ein Stream mit einem eingebetteten Bild. Um die Sache zu verkomplizieren, können Hilfsmetadaten auch im Stream selbst gespeichert werden. Wenn wir noch weiter gehen, können wir PDF in die Metadaten des Bildstroms einbetten und so eine unendliche Rekursion erreichen! Denken Sie also beim nächsten Überprüfen von Metadaten auf Informationen daran, dass Sie möglicherweise mehrere Ebenen durchlaufen müssen, um die gesuchten Informationen zu finden.

Zusätzliches Speichern / Aktualisieren


Der PDF-Standard verfügt über ein zusätzliches Speicherkonzept, das viele Anwendungen, einschließlich PSPDFKit, implementieren, um das Speichern zu beschleunigen. Kurz gesagt, diese Methode fügt am Ende des Dokuments zusätzliche Informationen hinzu, und alte Objekte, auf die nicht mehr verwiesen wird, bleiben dort hängen. Dies ist ideal, wenn Sie Dokumentelemente im laufenden Betrieb ändern und nicht auf einen langen Speichervorgang oder beispielsweise auf die automatische Speicherfunktion warten möchten, bei der der Prozess im Hintergrundthread ausgeführt wird und ein Minimum an Ressourcen verwendet werden soll.

Wie Sie verstehen können, öffnet dies eine ganze Büchse der Pandora: Der Verlauf des Dokuments zeigt vertrauliche oder fehlerhafte Informationen, die aus den Augen gelöscht wurden, aber im Dokument verblieben sind. In solchen Situationen wird empfohlen, das Dokument vollständig zu speichern. Dies führt dazu, dass alte Objekte entfernt oder sogar „geglättet“ werden, sodass die Formulare in Zukunft nicht mehr bearbeitet werden können.

PDF Kommentare


Viele Programmiersprachen bieten Kommentare an, sodass der Compiler oder Interpreter die Zeichenfolge ignoriert. Dieselbe Option ist in der PDF-Datei enthalten. Das% -Symbol wird im Format auf unterschiedliche Weise verwendet, aber eines davon ist ein Hinweis auf einen Kommentar im Code. Wenn der Benutzer das Dokument in einem Texteditor öffnet, werden möglicherweise einige geheime Nachrichten von Ihrem PDF-Prozessor eingefügt. PDF-Renderer ignorieren diese Kommentarzeilen, sodass die Datei korrekt aussieht und nach dem Rendern keine Kommentare mehr anzeigt.

Ein großes Wörterbuch!


Das Letzte, was zu beachten ist, ist, dass das PDF-Format tatsächlich ein großes Wörterbuch ist! Technisch kann jeder ein Dokument einbetten und etwas ändern. Nicht jede Änderung ist so einfach wie das Bearbeiten einer einzelnen Zeile, aber sie kann durchgeführt werden. Aus diesem Grund sollten Sie immer daran denken, welche Informationen in der PDF-Datei versteckt sein können. Wenn Sie vertrauliche Informationen verarbeiten, sollten Sie außerdem auf jeden Fall digitale Signaturen verwenden, um sicherzustellen, dass das Dokument nicht von einer anderen Person als dem Autor geändert wurde und dass der Autor derjenige ist, den Sie erwarten, und nicht jemand anderes.

Fazit


In diesem Artikel werden einige Möglichkeiten aufgeführt, wie Metadaten ohne Ihr Wissen in ein Dokument eingegeben werden können. Es sind noch weitere Faktoren zu berücksichtigen, z. B. die JavaScript-Unterstützung für PDF . Mit JavaScript sind die Optionen im Allgemeinen endlos. Versteckte Objekte können auch in Dokumenten gespeichert werden, die normalerweise analysiert, aber nicht angezeigt werden. Dies ist eine gute Möglichkeit, Informationen in den Parser einzufügen. PDF ist ein sehr umfangreicher Standard, daher sollten Sie immer wissen, welche Art von PDF-Reader-Software Sie verwenden, und ihm vertrauen.

Source: https://habr.com/ru/post/de429138/


All Articles