Java의 Markdown 파일에서 텍스트를 추출하는 방법

이 사용 방법 문서에서는 Java의 Markdown 파일에서 텍스트를 추출하는 단계별 프로세스를 설명하고 텍스트를 가져오는 방법의 구현을 보여주는 샘플 코드 스니펫을 공유합니다. Java를 사용하는 Markdown에서. 텍스트 추출을 위해 다른 타사 도구를 설치할 필요가 없으며 Windows, macOS 및 Linux를 포함한 일반적인 운영 체제에서 이 가이드를 따를 수 있습니다. 다음은 MD 파일에서 텍스트를 가져오기 위한 워크플로 및 코드 스니펫입니다.

Java의 Markdown 파일에서 텍스트를 추출하는 단계

  1. Java 애플리케이션의 Maven 저장소에서 GroupDocs.Parser for Java을 설정하여 Markdown 파일에서 텍스트를 추출합니다.
  2. Markdown 문서에서 텍스트를 추출하는 기능을 개발하는 데 필요한 클래스 가져오기
  3. MD 파일을 로드하여 텍스트를 추출하기 위한 Parser 클래스를 초기화합니다.
  4. getText 메서드를 호출하여 텍스트 판독기 객체를 얻습니다.
  5. 마지막으로 리더의 readToEnd 메서드를 호출하고 화면에 텍스트를 출력합니다.

Java 응용 프로그램의 MD에서 *텍스트 추출기는 위의 단계를 순서대로 수행하여 빠르게 만들 수 있습니다. 작업 흐름은 매우 간단하며 필요한 라이브러리를 설정하고 필요한 클래스를 가져와서 텍스트 추출 절차를 초기화할 수 있습니다. 그런 다음 MD 파일에서 텍스트를 가져오기 위해 Parser 클래스를 로드하여 MD 파일을 초기화해야 합니다. 마지막 두 단계는 입력 문서에서 텍스트를 가져온 다음 화면에 인쇄하는 방법을 활성화합니다.

Java의 Markdown 파일에서 텍스트를 추출하는 코드

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.licensing.License;
import com.groupdocs.parser.data.TextReader;
import java.io.IOException;
public class ExtractTextFromMarkdownFileInJava {
public static void main(String[] args) throws IOException { // Main function to extract text from Markdown in Java
// Remove the watermark in output
License lic = new License();
lic.setLicense("GroupDocs.Parser.lic");
// Create an instance of Parser class
try (Parser parser = new Parser("sample.md")) {
// Extract a text into the reader
try (TextReader reader = parser.getText()) {
// Print a text from the document
// If text extraction isn't supported, a reader is null
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd());
}
}
}
}

이전 코드 스니펫에서는 이전 섹션에서 정의한 워크플로의 도움으로 Java를 사용하여 Markdown 파일에서 텍스트를 추출하는 기능을 개발했습니다. 이것은 작동하는 코드이며 텍스트를 추출하기 위해 응용 프로그램에서 사용할 수 있지만 요구 사항에 따라 추가로 향상시킬 수 있습니다. 또한 DOC, DOCX, PDF, XLSX, XML, HTML 등과 같은 다른 문서 형식에서 텍스트를 가져오도록 이 예제를 수정할 수 있습니다.

Java의 Markdown에서 텍스트를 가져오는 방법에 대한 자세한 프로세스를 논의하고 이를 위한 샘플 코드를 개발했습니다. 최근 Java를 사용하여 PowerPoint에서 이미지를 추출하는 방법에 대한 기사를 게시했습니다. 자세한 내용은 Java의 PowerPoint에서 이미지를 추출하는 방법 가이드를 참조하세요.

 한국인