यह संक्षिप्त ट्यूटोरियल जावा का उपयोग करके पीडीएफ से मेटाडेटा निकालने की चरण-दर-चरण प्रक्रिया का वर्णन करता है। हम PDF दस्तावेज़ से मेटाडेटा प्राप्त करने के लिए सबसे अच्छे मेटाडेटा एक्सट्रैक्टर API में से एक का उपयोग करेंगे। इसके अलावा, आप सीखेंगे कि ** जावा में पीडीएफ से मेटाडेटा प्राप्त करने के लिए कार्यक्षमता बनाने के लिए कोड कैसे लिखें **। दस्तावेज़ों से मेटाडेटा निकालने के लिए विस्तृत निर्देश और नमूना कोड नीचे दिए गए हैं।
जावा का उपयोग करके पीडीएफ से मेटाडेटा निकालने के चरण
- पीडीएफ दस्तावेज़ से मेटाडेटा निकालने के लिए जावा प्रोजेक्ट में मावेन रिपॉजिटरी से GroupDocs.Parser for Java इंस्टॉल करें
- पीडीएफ दस्तावेज़ से मेटाडेटा निकालने के लिए कार्यक्षमता विकसित करने के लिए आवश्यक कक्षाएं आयात करें
- Parser क्लास का एक इंस्टेंस बनाएं और सोर्स पीडीएफ फाइल को उसके कंस्ट्रक्टर को पास करें
- GetMetadata विधि को कॉल करें और PDF दस्तावेज़ मेटाडेटा ऑब्जेक्ट का संग्रह प्राप्त करें
- अंत में, संग्रह के माध्यम से पुनरावृति करें और मेटाडेटा नाम और मान प्रदर्शित करें
हमने *जावा का उपयोग करके पीडीएफ मेटाडेटा प्राप्त करने के लिए चरणबद्ध निर्देश सूचीबद्ध किए हैं। पीडीएफ दस्तावेज़ से मेटाडेटा निकालने के लिए आपको इन बिंदुओं का एक क्रम में पालन करना होगा और इसके लिए आपको कोई अतिरिक्त सॉफ़्टवेयर सेट करने की आवश्यकता नहीं है। इन चरणों का उपयोग एमएस विंडोज, लिनक्स और मैक ओएस सहित किसी भी ऑपरेटिंग सिस्टम पर किया जा सकता है।
जावा का उपयोग करके पीडीएफ से मेटाडेटा निकालने के लिए कोड
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.MetadataItem; | |
public class ExtractMetadataFromPdfUsingJava { | |
public static void main(String[] args) { // Main function to extract metadata from PDF in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.pdf")) { | |
// Extract metadata from the document | |
Iterable < MetadataItem > metadata = parser.getMetadata(); | |
// Check if metadata extraction is supported | |
if (metadata == null) { | |
System.out.println("Metatada extraction isn't supported"); | |
} | |
// Iterate over metadata items | |
for (MetadataItem item: metadata) { | |
// Print an item name and value | |
System.out.println(String.format("%s: %s", item.getName(), item.getValue())); | |
} | |
} | |
} | |
} |
उपरोक्त उदाहरण में, हमने जावा पीडीएफ मेटाडेटा क्षमता विकसित की है। जैसा कि आप देख सकते हैं, पार्सर वर्ग का उपयोग मेटाडेटा प्राप्त करने के लिए इनपुट पीडीएफ दस्तावेज़ लोड करने के लिए किया जाता है। उसके बाद, हमने मेटाडेटा के नाम और मूल्य को प्रदर्शित करने के लिए मेटाडेटा एकत्र करने और उस पर पुनरावृति करने के लिए getMetadata विधि को कॉल किया है। आप विभिन्न दस्तावेज़ स्वरूपों जैसे DOCX, XLSX, PPTX, MSG, EML, EPUB, और कई अन्य से मेटाडेटा भी निकाल सकते हैं।
हमने जावा में पीडीएफ से मेटाडेटा निकालने की विस्तृत प्रक्रिया पर चर्चा की है। हाल ही में, हमने जावा में Word दस्तावेज़ से मेटाडेटा निकालने पर एक लेख प्रकाशित किया है, अधिक जानकारी के लिए जावा का उपयोग करके Word दस्तावेज़ से मेटाडेटा कैसे निकालें? मार्गदर्शिका देखें।