
File PDF memiliki banyak informasi. Sebagian besar digunakan untuk visualisasi dokumen yang sama pada platform yang berbeda. Tetapi ada juga banyak metadata: tanggal dan waktu pembuatan dan pengeditan, aplikasi yang digunakan, topik dokumen, judul, penulis, dan banyak lagi. Ini adalah set standar metadata, dan ada cara untuk memasukkan metadata khusus ke dalam PDF: komentar tersembunyi di tengah file. Dalam artikel ini, kami akan menyajikan beberapa bentuk metadata dan menunjukkan di mana mencarinya.
Metadata informasi
Dimulai dengan PDF 1.0, ada satu set nilai standar yang dapat ditambahkan lebih lanjut ke dokumen. Manajer file menggunakan nilai-nilai ini untuk meningkatkan pencarian dokumen. Mereka termasuk:
- Penulis
- Tanggal pembuatan
- Pencipta
- Produser
Dalam PDF 1.1, set ini diperluas untuk memasukkan data tambahan yang membantu menemukan dokumen:
- Judul
- Tema
- Kata kunci
- Tanggal Pengeditan (ModDate)
Sebenarnya, informasi ini sebenarnya tidak disembunyikan, karena banyak aplikasi memungkinkan Anda untuk melihatnya. Tapi itu tidak diperlihatkan kepada masyarakat umum. Bagaimanapun, jika Anda khawatir tentang keamanan, Anda harus hati-hati mengandalkan informasi ini karena dapat diedit nanti. Karena metadata dapat diperbarui secara terpisah dari konten yang ditampilkan, ini berarti bahwa manajer file dan metadata akan menunjukkan perubahan, dan kontennya mungkin tidak berubah.

Metadata tambahan
Standar PDF sekarang mendukung lebih banyak metadata. Alih-alih satu set kecil nilai default, Anda dapat menyimpan seluruh aliran informasi dalam format
XMP . Akibatnya, semua jenis data dapat disematkan di sana. Sekali lagi, mereka tidak ditampilkan, tetapi mereka dapat dianalisis oleh manajer file.
Aliran XMP dapat disandikan, sehingga tidak selalu dibaca oleh orang-orang, tetapi banyak aplikasi dapat membaca dan mengedit informasi ini. Berikut adalah contoh bagaimana XMP terlihat dalam format yang dapat dibaca manusia:
<xmp:CreateDate>1851-08-18</xmp:CreateDate> <xmp:CreatorTool>Ink and Paper</xmp:CreatorTool> <dc:creator> <rdf:Seq> <rdf:li>Nick Winder</rdf:li> </rdf:Seq> </dc:creator> <dc:title> <rdf:Alt> <rdf:li xml:lang="x-default">My Amazing PDF</rdf:li> </rdf:Alt> </dc:title>
Sangat mudah untuk memahami bahwa informasi ini sangat berharga ketika mencoba menentukan sejarah suatu dokumen atau mencoba menanamkan informasi lainnya. PSPDFKit untuk
iOS dan
Android mendukung membaca dan mengedit metadata.
Metadata objek
Aliran metadata tidak terbatas pada dokumen; metadata juga dapat ditugaskan ke objek apa pun dalam dokumen. Misalnya, streaming dengan gambar yang disematkan. Untuk memperumit masalah, metadata tambahan juga dapat disimpan dalam aliran itu sendiri. Jika kita melangkah lebih jauh, kita dapat
menanamkan PDF dalam metadata aliran gambar , sehingga mencapai rekursi tak terbatas! Jadi lain kali Anda memeriksa metadata untuk informasi, ingatlah bahwa Anda mungkin harus melewati beberapa level untuk menemukan informasi yang Anda cari.
Simpan / perbarui tambahan
Standar PDF memiliki konsep penyimpanan tambahan yang diterapkan banyak aplikasi, termasuk PSPDFKit untuk mempercepat penghematan. Singkatnya, metode ini menambahkan informasi tambahan ke akhir dokumen, dan benda-benda tua yang tidak lagi dirujuk akan tetap menggantung di sana. Ini bagus ketika Anda mengubah elemen dokumen dengan cepat dan tidak ingin menunggu proses penyimpanan yang lama, atau, misalnya, untuk fungsi penyimpanan otomatis, tempat proses berjalan di utas latar belakang, dan kami ingin menggunakan sumber daya minimum.
Seperti yang dapat Anda pahami, ini membuka seluruh kotak Pandora: sejarah dokumen menunjukkan informasi rahasia atau salah yang telah dihapus dari mata, tetapi tetap ada dalam dokumen. Dalam situasi seperti itu, Anda disarankan untuk menyimpan dokumen sepenuhnya. Ini akan menghasilkan penghapusan objek lama atau bahkan "smoothing", sehingga
formulir tidak dapat diedit di masa depan.
Komentar PDF
Banyak bahasa pemrograman memberikan komentar sehingga kompiler atau interpreter mengabaikan string, opsi yang sama ada dalam PDF. Simbol% digunakan dalam format dengan cara yang berbeda, tetapi salah satunya adalah indikasi komentar dalam kode. Oleh karena itu, jika pengguna membuka dokumen dalam editor teks, ia mungkin melihat beberapa pesan rahasia dimasukkan oleh prosesor PDF Anda. Perender PDF akan mengabaikan baris komentar ini, sehingga file terlihat benar dan tidak menunjukkan komentar apa pun setelah rendering.
Satu kamus besar!
Hal terakhir yang perlu diperhatikan adalah bahwa format PDF sebenarnya adalah satu kamus besar! Secara teknis, siapa pun dapat menanamkan dokumen dan mengubah sesuatu. Tidak setiap perubahan semudah mengedit satu baris, tetapi itu bisa dilakukan. Karena alasan ini, Anda harus selalu mengingat informasi apa yang mungkin disembunyikan dalam PDF. Selain itu, jika Anda memproses informasi rahasia, Anda harus menggunakan
tanda tangan digital untuk memastikan bahwa dokumen tersebut belum diubah oleh orang lain selain penulisnya, dan bahwa penulisnya adalah yang Anda harapkan dan bukan orang lain.
Kesimpulan
Artikel ini mencantumkan beberapa cara agar metadata dapat memasukkan dokumen tanpa sepengetahuan Anda. Ada faktor lain yang perlu dipertimbangkan, seperti
dukungan JavaScript untuk PDF . Dengan JavaScript, opsinya umumnya tidak ada habisnya. Objek tersembunyi juga dapat disimpan dalam dokumen, yang biasanya dianalisis tetapi tidak ditampilkan. Ini adalah cara yang baik untuk menyuntikkan beberapa jenis informasi ke dalam pengurai. PDF adalah standar yang sangat luas, jadi Anda harus selalu tahu jenis perangkat lunak pembaca PDF yang Anda gunakan dan percayai.