W tym samouczku wyjaśniamy, jak wyodrębnić metadane z dokumentu Word przy użyciu języka Java. Ten artykuł zawiera informacje dotyczące konfigurowania biblioteki wyodrębniania metadanych, instrukcje krok po kroku dotyczące pobierania metadanych z dokumentów DOC lub DOCX oraz przykładowy kod demonstrujący działanie funkcji Dokument programu Word z metadanymi Java. Oto kroki i kod, aby uzyskać metadane z dokumentów edytora Word.
Kroki, aby wyodrębnić metadane z dokumentu programu Word przy użyciu języka Java
- Zainstaluj GroupDocs.Parser for Java z repozytorium Maven w aplikacji Java, aby wyodrębnić metadane z dokumentu Word
- Importuj podstawowe klasy do rozwijania funkcjonalności wyodrębniania metadanych z programu Word
- Utwórz instancję klasy Parser i przekaż źródłowy plik Word do jej konstruktora
- Wywołaj metodę getMetadata i uzyskaj kolekcję obiektów metadanych dokumentu DOCX
- Na koniec użyj pętli for, aby przejrzeć kolekcję i uzyskać nazwy i wartości metadanych
W powyższych punktach wyjaśniliśmy każdy krok tworzenia funkcjonalności umożliwiającej pobieranie metadanych programu Word w Javie. W pierwszym kroku musisz skonfigurować wymaganą bibliotekę ekstrakcji metadanych i zaimportować niezbędne klasy. W następnym kroku załaduj wejściowy plik Word, inicjując klasę Parser w celu wyodrębnienia metadanych. W ostatnim kroku użyj metody getMetadata klasy Parser do zebrania obiektów metadanych dla dokumentu programu Word, a następnie wykonaj iterację w celu wyświetlenia nazwy i wartości metadanych.
Kod do wyodrębniania metadanych z dokumentu programu Word przy użyciu języka Java
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.data.MetadataItem; | |
public class ExtractMetadataFromWordDocumentUsingJava { | |
public static void main(String[] args) { // Main function to extract Metadata from Word document in Java | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.docx")) { | |
// Extract metadata from the document | |
Iterable < MetadataItem > metadata = parser.getMetadata(); | |
// Check if metadata extraction is supported | |
if (metadata == null) { | |
System.out.println("Metatada extraction isn't supported"); | |
} | |
// Iterate over metadata items | |
for (MetadataItem item: metadata) { | |
// Print an item name and value | |
System.out.println(String.format("%s: %s", item.getName(), item.getValue())); | |
} | |
} | |
} | |
} |
Opracowaliśmy powyższy fragment kodu, aby pokazać implementację pobierania metadanych dokumentu programu Word przy użyciu funkcji Java. Napisaliśmy kilka linii kodu i użyliśmy kilku wywołań API do wyodrębnienia metadanych z pliku Word. Co więcej, tego kodu można użyć w dowolnym systemie operacyjnym, takim jak MS Windows, Linux i Mac OS, bez instalowania oprogramowania innych firm. Ponadto możesz używać interfejsów API wyodrębniania metadanych do wyodrębniania metadanych z różnych formatów dokumentów, takich jak PDF, XLSX, PPTX, MSG, EML, EPUB i wielu innych.