У цій статті з інструкціями ми пояснимо крок за кроком процес вилучення тексту з файлу Markdown у Java та поділимося прикладом фрагмента коду, щоб продемонструвати реалізацію того, як отримати текст з Markdown за допомогою Java. Вам не потрібно встановлювати будь-які сторонні інструменти для вилучення тексту, і цей посібник можна використовувати в будь-якій із поширених операційних систем, включаючи Windows, macOS і Linux. Нижче наведено робочий процес і фрагмент коду для отримання тексту з файлу MD.
Кроки для вилучення тексту з файлу Markdown у Java
- Налаштуйте GroupDocs.Parser for Java зі сховища Maven у програмі Java, щоб отримати текст із файлу Markdown
- Імпортуйте необхідні класи для розробки функцій для вилучення тексту з документа Markdown
- Ініціалізуйте клас Parser для завантаження файлу MD, щоб отримати з нього текст
- Викличте метод getText, щоб отримати об’єкт читання тексту
- Нарешті, викличте метод читання readToEnd і виведіть текст на екран
Програму екстрактора тексту з програми MD in Java можна швидко створити, виконавши описані вище кроки в послідовності. Робочий процес дуже простий, і ви можете ініціалізувати процедуру вилучення тексту, налаштувавши необхідну бібліотеку та імпортувавши необхідні класи. Після цього вам потрібно ініціалізувати клас Parser для завантаження файлу MD для отримання з нього тексту. Останні два кроки дозволяють отримати текст із вхідного документа, а потім надрукувати його на екрані.
Код для вилучення тексту з файлу Markdown у Java
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.licensing.License; | |
import com.groupdocs.parser.data.TextReader; | |
import java.io.IOException; | |
public class ExtractTextFromMarkdownFileInJava { | |
public static void main(String[] args) throws IOException { // Main function to extract text from Markdown in Java | |
// Remove the watermark in output | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Parser.lic"); | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.md")) { | |
// Extract a text into the reader | |
try (TextReader reader = parser.getText()) { | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd()); | |
} | |
} | |
} | |
} |
У попередньому фрагменті коду ми розробили функцію для вилучення тексту з файлу Markdown за допомогою Java за допомогою робочого процесу, визначеного в попередньому розділі. Це робочий код, і ви можете використовувати його у своїх програмах для видобування тексту, однак ви можете вдосконалити його відповідно до ваших вимог. Крім того, ви можете змінити цей приклад для отримання тексту з інших форматів документів, таких як DOC, DOCX, PDF, XLSX, XML, HTML та багатьох інших.
Ми детально обговорили процес отримання тексту з Markdown у Java та розробили зразок коду для цього. Нещодавно ми опублікували статтю про видобування зображень із PowerPoint за допомогою Java, перегляньте посібник як витягти зображення з PowerPoint на Java для отримання додаткової інформації.