Σε αυτό το σεμινάριο, σας εξηγούμε πώς να εξάγετε μεταδεδομένα από το έγγραφο Word χρησιμοποιώντας Java. Αυτό το άρθρο περιέχει πληροφορίες για τη ρύθμιση παραμέτρων της βιβλιοθήκης εξαγωγής μεταδεδομένων, σταδιακές οδηγίες για τη λήψη μεταδεδομένων από έγγραφα DOC ή DOCX και ένα δείγμα κώδικα για την επίδειξη της λειτουργίας της ικανότητας Java μεταδεδομένων Word document. Ακολουθούν τα βήματα και ο κώδικας για τη λήψη μεταδεδομένων από έγγραφα επεξεργασίας κειμένου.
Βήματα για την εξαγωγή μεταδεδομένων από το έγγραφο του Word χρησιμοποιώντας Java
- Εγκαταστήστε το GroupDocs.Parser for Java από το αποθετήριο Maven στην εφαρμογή Java για εξαγωγή μεταδεδομένων από έγγραφο του Word
- Εισαγάγετε βασικές τάξεις για την ανάπτυξη της λειτουργικότητας για την εξαγωγή μεταδεδομένων από το Word
- Δημιουργήστε μια παρουσία της κλάσης Parser και περάστε το αρχείο προέλευσης Word στον κατασκευαστή της
- Καλέστε τη μέθοδο getMetadata και αποκτήστε μια συλλογή από αντικείμενα μεταδεδομένων εγγράφου DOCX
- Τέλος, χρησιμοποιήστε το for loop για να επαναλάβετε τη συλλογή και να λάβετε ονόματα και τιμές μεταδεδομένων
Στα παραπάνω σημεία, έχουμε εξηγήσει κάθε βήμα για τη δημιουργία της λειτουργικότητας για λήψη μεταδεδομένων Word σε Java. Στο πρώτο βήμα, πρέπει να ρυθμίσετε την απαιτούμενη βιβλιοθήκη εξαγωγής μεταδεδομένων και να εισαγάγετε τις απαραίτητες κλάσεις. Στο επόμενο βήμα, φορτώστε το αρχείο εισόδου Word εκκινώντας την κλάση Parser για την εξαγωγή των μεταδεδομένων. Στο τελευταίο βήμα, χρησιμοποιήστε τη μέθοδο getMetadata της κλάσης Parser για τη συλλογή των αντικειμένων μεταδεδομένων για το έγγραφο του Word και, στη συνέχεια, επαναλάβετε για την εμφάνιση του ονόματος και των τιμών για τα μεταδεδομένα.
Κώδικας για εξαγωγή μεταδεδομένων από έγγραφο του Word χρησιμοποιώντας Java
Αναπτύξαμε το παραπάνω απόσπασμα κώδικα για να δείξουμε την υλοποίηση για λήψη μεταδεδομένων εγγράφου του Word χρησιμοποιώντας τη δυνατότητα Java. Έχουμε γράψει μερικές γραμμές κώδικα και χρησιμοποιήσαμε μερικές κλήσεις API για την εξαγωγή των μεταδεδομένων από το αρχείο Word. Επιπλέον, αυτός ο κώδικας μπορεί να χρησιμοποιηθεί σε οποιοδήποτε λειτουργικό σύστημα όπως MS Windows, Linux και Mac OS χωρίς να εγκαταστήσετε λογισμικό τρίτων. Επιπλέον, μπορείτε να χρησιμοποιήσετε API εξαγωγής μεταδεδομένων για εξαγωγή μεταδεδομένων από διάφορες μορφές εγγράφων όπως PDF, XLSX, PPTX, MSG, EML, EPUB και πολλά άλλα.