Այս հոդվածում մենք կկենտրոնանանք քայլ առ քայլ ընթացակարգի վրա՝ Տեքստ PowerPoint-ից Java-ի միջոցով հանելու և ինչպես այս հրահանգները վերածել հավելվածի մշակման՝ տեքստը հանելու {{HYPERLINK1-ից: }} Java-ում: Ավելին, մենք կօգտագործենք փաստաթղթերի տվյալների արդյունահանման գրադարանի մի քանի պարզ API զանգեր՝ փաստաթղթերից տեքստը հանելու համար: Ահա հիմնական քայլերը, ինչպես նաև կոդ օրինակ՝ PowerPoint-ից Java-ում տեքստ հանելու համար:
Java-ի միջոցով PowerPoint-ից տեքստ հանելու քայլեր
- Տեղադրեք GroupDocs.Parser for Java-ը Maven շտեմարանից Java նախագծում՝ PowerPoint փաստաթղթից տեքստ հանելու համար
- Ներմուծեք էական դասեր՝ PowerPoint ֆայլից տեքստ հանելու ֆունկցիոնալությունը զարգացնելու համար
- Ստեղծեք Parser դասի օրինակ՝ մուտքագրված PowerPoint փաստաթուղթը բեռնելու համար՝ դրանից տեքստ հանելու համար։
- Զանգահարեք getText մեթոդը TextReader օբյեկտը ստանալու համար
- Ի վերջո, կարդացեք տեքստը ընթերցողից և տպեք այն
Մենք թվարկել ենք բոլոր այն կետերը, որոնք էական են Java*-ի միջոցով *PPT-ից տեքստը հանելու համար: Այս քայլերը պարզ են, որոնք պետք է հետևել PowerPoint ֆայլից տեքստ ստանալու համար և կարող են օգտագործվել ցանկացած ընդհանուր օպերացիոն համակարգում, ինչպիսիք են Windows-ը, Linux-ը և macOS-ը: Ավելին, այս հրահանգները չեն պահանջում որևէ լրացուցիչ ծրագրակազմի տեղադրում ֆունկցիոնալության իրականացման համար:
Կոդ՝ Java-ի միջոցով PowerPoint-ից տեքստ հանելու համար
import com.groupdocs.parser.Parser; | |
import com.groupdocs.parser.licensing.License; | |
import com.groupdocs.parser.data.TextReader; | |
import java.io.IOException; | |
public class ExtractTextFromPowerpointUsingJava { | |
public static void main(String[] args) throws IOException { // Main function to extract text from PowerPoint in Java | |
// Remove the watermark in output | |
License lic = new License(); | |
lic.setLicense("GroupDocs.Parser.lic"); | |
// Create an instance of Parser class | |
try (Parser parser = new Parser("sample.pptx")) { | |
// Extract a text into the reader | |
try (TextReader reader = parser.getText()) { | |
// Print a text from the document | |
// If text extraction isn't supported, a reader is null | |
System.out.println(reader == null ? "Text extraction isn't supported" : reader.readToEnd()); | |
} | |
} | |
} | |
} |
Նախորդ կոդի հատվածում մենք մշակել ենք ստանալ տեքստ PowerPoint Java հավելվածը՝ հատկանիշի իրականացումը ցույց տալու համար: PPT ֆայլից տեքստ հանելու համար անհրաժեշտ է ստեղծել անհրաժեշտ գրադարանը, այնուհետև ներառել անհրաժեշտ դասերը: Դրանից հետո բեռնեք մուտքագրված PPTX ֆայլը՝ սկզբնավորելով Parser դասը և օգտագործեք getText մեթոդը՝ TextReader հավաքածուն ստանալու համար։ Ի վերջո, դուք պետք է տպեք տեքստը, կարդալով տեքստը ընթերցողից:
Մենք քննարկել ենք այն մանրամասն գործընթացը, թե ինչպես զարգացնել Java-ն՝ ստանալ տեքստ PowerPoint-ից և ստեղծել ենք դրա համար օրինակելի կոդը: Վերջերս մենք հրապարակեցինք հոդված Java-ի միջոցով HTML-ից տեքստ հանելու մասին, լրացուցիչ տեղեկությունների համար դիտեք ինչպես հանել տեքստը HTML-ից Java-ում ուղեցույցը: