Ինչպես վերածել HTML-ը տեքստի Java-ի միջոցով

Այս արագ ձեռնարկը մանրամասն հրահանգներ է տալիս փոխակերպելու HTMLText-ի Java-ի միջոցով և օրինակելի կոդ՝ ցույց տալու Java HTML-ի պարզ տեքստի կարողությունը: Այս ուղեցույցը օգտագործում է փաստաթղթերի փոխակերպման լավագույն գրադարաններից մեկը՝ փաստաթղթերի փոխակերպման համար, և այն կարող է տեղադրվել ցանկացած օպերացիոն համակարգում, ներառյալ MS Windows, Linux և Mac OS: Ահա HTML-ը որպես տեքստ Java-ում պահելու քայլերը և կոդերի օրինակը:

Java-ի միջոցով HTML-ը տեքստի փոխարկելու քայլեր

  1. Կարգավորեք GroupDocs.Conversion for Java-ը Maven պահոցից HTML-ի տեքստի գործառույթն իրականացնելու համար
  2. Ներմուծեք էական դասեր՝ փաստաթղթերը HTML-ից տեքստի փոխակերպելու համար
  3. Տեղադրեք Converter դասը և փոխանցեք սկզբնաղբյուր HTML ֆայլը դրա կառուցողին
  4. Նախաձեռնեք WordProcessingConvertOptions դասը և սահմանեք ելքային տեքստային ֆայլը հարմարեցնելու պարամետրեր
  5. Վերջապես, կանչեք Converter դասի Convert մեթոդը և փոխանցեք ստացված TXT ֆայլի ուղին WordProcessingConvertOptions օբյեկտի հետ միասին:

HTML-ը Java-ում տեքստի փոխակերպելու գործառույթ ստեղծելու համար հետևեք վերը նշված կետերին հաջորդականությամբ: Նախ տեղադրեք անհրաժեշտ գրադարանը և ներմուծեք հիմնական դասերը: Այնուհետև բեռնեք HTML փաստաթուղթը փոխակերպման համար և սահմանեք փոխարկված տեքստային փաստաթուղթը հարմարեցնելու պարամետրեր: Ի վերջո, Convert մեթոդը թույլ է տալիս պահպանել ստացված ֆայլը սկավառակի վրա:

Կոդ՝ Java-ի միջոցով HTML-ը տեքստի փոխակերպելու համար

import com.groupdocs.conversion.Converter;
import com.groupdocs.conversion.licensing.License;
import com.groupdocs.conversion.options.convert.WordProcessingConvertOptions;
import com.groupdocs.conversion.filetypes.WordProcessingFileType;
public class ConvertHtmlToTextUsingJava {
public static void main(String[] args) { // Main function to convert HTML to Text in Java
// Remove the watermark in output Text document by adding license
License lic = new License();
lic.setLicense("GroupDocs.Conversion.lic");
// Load the source HTML file for conversion to Text
Converter converter = new Converter("sample.html");
// Set the convert options for TXT format
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setFormat(WordProcessingFileType.Txt); // Specify the conversion format
// Convert and save the HTML in TXT format
converter.convert("converted.txt", options);
System.out.println("Done");
}
}

Կոդի այս հատվածը մշակվել է ցուցադրելու փոխակերպել HTML-ը պարզ տեքստի Java կարողության իրականացումը: Մենք օգտագործել ենք փաստաթղթերի փոխարկիչ գրադարանի մի քանի API զանգեր՝ սկզբնաղբյուր ֆայլը անհրաժեշտ ձևաչափին փոխակերպելու համար: Ավելին, այն չի պահանջում որևէ այլ երրորդ կողմի ծրագրակազմ՝ փաստաթուղթը փոխակերպելու համար: Ավելին, շատ հեշտ ընթացակարգ է տարբեր փաստաթղթեր փոխարկել TXT ձևաչափի, ինչպիսիք են DOCX, CSV, DOT, DWG, EML, MD և շատ ավելին:

Մենք քննարկել ենք փաստաթղթերի փոխակերպման մանրամասն հրահանգներ՝ Java-ում HTML-ը տեքստի փոխելու համար: Վերջերս մենք հրապարակեցինք հոդված PDF-ը Java-ի CSV-ի փոխարկելու մասին, լրացուցիչ տեղեկությունների համար նայեք ինչպես փոխարկել PDF-ը CSV-ի Java-ի միջոցով գրառմանը:

 Հայերեն