วิธีแยกข้อมูลเมตาจาก PDF โดยใช้ Java

บทช่วยสอนสั้นๆ นี้อธิบายกระบวนการทีละขั้นตอนในการ แยกข้อมูลเมตาจาก PDF โดยใช้ Java เราจะใช้หนึ่งใน API ตัวแยกข้อมูลเมตาที่ดีที่สุดสำหรับการดึงข้อมูลเมตาจากเอกสาร PDF นอกจากนี้ คุณจะได้เรียนรู้วิธีเขียนโค้ดเพื่อสร้างฟังก์ชันสำหรับ รับข้อมูลเมตาจาก PDF ใน Java ด้านล่างนี้คือคำแนะนำโดยละเอียดและโค้ดตัวอย่างสำหรับการแยกข้อมูลเมตาจากเอกสาร

ขั้นตอนในการดึงข้อมูลเมตาจาก PDF โดยใช้ Java

  1. ติดตั้ง GroupDocs.Parser for Java จากที่เก็บ Maven ในโครงการ Java เพื่อดึงข้อมูลเมตาจากเอกสาร PDF
  2. นำเข้าคลาสที่จำเป็นสำหรับการพัฒนาฟังก์ชันสำหรับการแยกข้อมูลเมตาจากเอกสาร PDF
  3. สร้างอินสแตนซ์ของคลาส Parser และส่งไฟล์ PDF ต้นทางไปยังตัวสร้าง
  4. เรียกใช้เมธอด getMetadata และรับคอลเลกชันของวัตถุข้อมูลเมตาของเอกสาร PDF
  5. สุดท้าย วนซ้ำผ่านคอลเลกชันและแสดงชื่อและค่าข้อมูลเมตา

เราได้แสดงรายการคำแนะนำแบบเป็นขั้นเป็นตอนเพื่อ รับข้อมูลเมตา PDF โดยใช้ Java คุณต้องปฏิบัติตามจุดเหล่านี้ตามลำดับเพื่อแยกข้อมูลเมตาจากเอกสาร PDF และคุณไม่จำเป็นต้องตั้งค่าซอฟต์แวร์เพิ่มเติมสำหรับมัน ขั้นตอนเหล่านี้ใช้ได้กับทุกระบบปฏิบัติการ รวมถึง MS Windows, Linux และ Mac OS

รหัสเพื่อดึงข้อมูลเมตาจาก PDF โดยใช้ Java

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.data.MetadataItem;
public class ExtractMetadataFromPdfUsingJava {
public static void main(String[] args) { // Main function to extract metadata from PDF in Java
// Create an instance of Parser class
try (Parser parser = new Parser("sample.pdf")) {
// Extract metadata from the document
Iterable < MetadataItem > metadata = parser.getMetadata();
// Check if metadata extraction is supported
if (metadata == null) {
System.out.println("Metatada extraction isn't supported");
}
// Iterate over metadata items
for (MetadataItem item: metadata) {
// Print an item name and value
System.out.println(String.format("%s: %s", item.getName(), item.getValue()));
}
}
}
}

ในตัวอย่างข้างต้น เราได้พัฒนาความสามารถของ Java PDF metadata อย่างที่คุณเห็น คลาส Parser ใช้สำหรับโหลดเอกสาร PDF อินพุตเพื่อรับข้อมูลเมตา หลังจากนั้น เราได้เรียกใช้เมธอด getMetadata เพื่อรวบรวมข้อมูลเมตาและวนซ้ำเพื่อแสดงชื่อและค่าของข้อมูลเมตา คุณยังสามารถดึงข้อมูลเมตาจากรูปแบบเอกสารต่างๆ เช่น DOCX, XLSX, PPTX, MSG, EML, EPUB และอื่นๆ อีกมากมาย

เราได้กล่าวถึงขั้นตอนโดยละเอียดในการดึงข้อมูลเมตาจาก PDF ใน Java เมื่อเร็ว ๆ นี้ เราได้เผยแพร่บทความเกี่ยวกับการแยกข้อมูลเมตาจากเอกสาร Word ใน Java ดูคำแนะนำ วิธีดึงข้อมูลเมตาจากเอกสาร Word โดยใช้ Java สำหรับข้อมูลเพิ่มเติม

 ไทย