كيفية تحويل HTML إلى نص باستخدام Java

يقدم هذا البرنامج التعليمي السريع إرشادات مفصلة ** لتحويل HTML إلى Text باستخدام Java ** ونموذج كود لإظهار تنفيذ ** Java HTML إلى نص عادي **. يستخدم هذا الدليل واحدة من أفضل مكتبات محول المستندات لإجراء تحويل المستند ويمكن تثبيته على أي نظام تشغيل بما في ذلك MS Windows و Linux و Mac OS. فيما يلي الخطوات ونموذج التعليمات البرمجية لحفظ HTML كنص في Java.

خطوات تحويل HTML إلى نص باستخدام Java

  1. قم بإعداد GroupDocs.Conversion for Java من مستودع Maven لتنفيذ وظائف HTML إلى Text
  2. استيراد الفئات الأساسية لإجراء تحويل المستند من HTML إلى نص
  3. أنشئ فئة Converter وقم بتمرير ملف HTML المصدر إلى المنشئ الخاص به
  4. تهيئة فئة WordProcessingConvertOptions وتحديد معاملات لتخصيص ملف نص المخرجات
  5. أخيرًا ، قم باستدعاء طريقة التحويل لفئة المحول ومرر مسار ملف TXT الناتج مع كائن WordProcessingConvertOptions

لإنشاء وظيفة * تحويل HTML إلى نص في Java * ، اتبع النقاط المذكورة أعلاه في تسلسل. بادئ ذي بدء ، قم بتثبيت المكتبة المطلوبة واستيراد الفئات الأساسية. بعد ذلك ، قم بتحميل مستند HTML للتحويل وحدد المعلمات لتخصيص مستند النص المحول. في النهاية ، تسمح طريقة التحويل بحفظ الملف الناتج على القرص.

كود لتحويل HTML إلى نص باستخدام Java

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.licensing.License;
import com.groupdocs.conversion.options.convert.WordProcessingConvertOptions;
import com.groupdocs.conversion.filetypes.WordProcessingFileType;
public class ConvertHtmlToTextUsingJava {
public static void main(String[] args) { // Main function to convert HTML to Text in Java
// Remove the watermark in output Text document by adding license
License lic = new License();
lic.setLicense("GroupDocs.Conversion.lic");
// Load the source HTML file for conversion to Text
Converter converter = new Converter("sample.html");
// Set the convert options for TXT format
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setFormat(WordProcessingFileType.Txt); // Specify the conversion format
// Convert and save the HTML in TXT format
converter.convert("converted.txt", options);
System.out.println("Done");
}
}

تم تطوير مقتطف الشفرة هذا لإثبات تنفيذ إمكانية * تحويل HTML إلى نص عادي Java *. لقد استهلكنا بعض استدعاءات API لمكتبة محول المستندات لتحويل الملف المصدر إلى التنسيق المطلوب. علاوة على ذلك ، فإنه لا يتطلب أي برنامج آخر تابع لجهة خارجية للقيام بتحويل المستند. علاوة على ذلك ، يعد تحويل المستندات المختلفة إلى تنسيق TXT إجراءً سهلاً للغاية مثل DOCX و CSV و DOT و DWG و EML و MD وغيرها الكثير.

لقد ناقشنا الإرشادات التفصيلية لإجراء تحويل المستند لتغيير HTML إلى نص في Java. لقد نشرنا مؤخرًا مقالًا حول تحويل PDF إلى CSV في Java ، ألق نظرة على منشور كيفية تحويل PDF إلى CSV باستخدام Java لمزيد من المعلومات.

 عربي