Як витягти текст із файлу Markdown у Java

У цій статті з інструкціями ми пояснимо крок за кроком процес вилучення тексту з файлу Markdown у Java та поділимося прикладом фрагмента коду, щоб продемонструвати реалізацію того, як отримати текст з Markdown за допомогою Java. Вам не потрібно встановлювати будь-які сторонні інструменти для вилучення тексту, і цей посібник можна використовувати в будь-якій із поширених операційних систем, включаючи Windows, macOS і Linux. Нижче наведено робочий процес і фрагмент коду для отримання тексту з файлу MD.

Кроки для вилучення тексту з файлу Markdown у Java

  1. Налаштуйте GroupDocs.Parser for Java зі сховища Maven у програмі Java, щоб отримати текст із файлу Markdown
  2. Імпортуйте необхідні класи для розробки функцій для вилучення тексту з документа Markdown
  3. Ініціалізуйте клас Parser для завантаження файлу MD, щоб отримати з нього текст
  4. Викличте метод getText, щоб отримати об’єкт читання тексту
  5. Нарешті, викличте метод читання readToEnd і виведіть текст на екран

Програму екстрактора тексту з програми MD in Java можна швидко створити, виконавши описані вище кроки в послідовності. Робочий процес дуже простий, і ви можете ініціалізувати процедуру вилучення тексту, налаштувавши необхідну бібліотеку та імпортувавши необхідні класи. Після цього вам потрібно ініціалізувати клас Parser для завантаження файлу MD для отримання з нього тексту. Останні два кроки дозволяють отримати текст із вхідного документа, а потім надрукувати його на екрані.

Код для вилучення тексту з файлу Markdown у Java

import com.groupdocs.parser.Parser;
import com.groupdocs.parser.licensing.License;
import com.groupdocs.parser.data.TextReader;
import java.io.IOException;
public class ExtractTextFromMarkdownFileInJava {
public static void main(String[] args) throws IOException { // Main function to extract text from Markdown in Java
// Remove the watermark in output
License lic = new License();
lic.setLicense("GroupDocs.Parser.lic");
// Create an instance of Parser class
try (Parser parser = new Parser("sample.md")) {
// Extract a text into the reader
try (TextReader reader = parser.getText()) {
// Print a text from the document
// If text extraction isn't supported, a reader is null
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd());
}
}
}
}

У попередньому фрагменті коду ми розробили функцію для вилучення тексту з файлу Markdown за допомогою Java за допомогою робочого процесу, визначеного в попередньому розділі. Це робочий код, і ви можете використовувати його у своїх програмах для видобування тексту, однак ви можете вдосконалити його відповідно до ваших вимог. Крім того, ви можете змінити цей приклад для отримання тексту з інших форматів документів, таких як DOC, DOCX, PDF, XLSX, XML, HTML та багатьох інших.

Ми детально обговорили процес отримання тексту з Markdown у Java та розробили зразок коду для цього. Нещодавно ми опублікували статтю про видобування зображень із PowerPoint за допомогою Java, перегляньте посібник як витягти зображення з PowerPoint на Java для отримання додаткової інформації.

 Українська