U ovom ćemo članku raspravljati o postupku korak po korak za konvertiranje Word dokumenta u Text u C#. Ovaj će vodič koristiti jedan od najboljih API-ja za pretvaranje dokumenata za izvođenje transformacije dokumenata. Nadalje, pruža upute za konfiguriranje potrebne biblioteke i prikazuje implementaciju aplikacije C# Word to Text converter. Štoviše, ove su upute neovisne o platformi i mogu se koristiti u bilo kojem od široko korištenih operativnih sustava kao što su Windows, Linux i macOS.
Koraci za pretvaranje Word dokumenta u tekst u C#
- Instalirajte paket GroupDocs.Conversion for .NET iz upravitelja paketa NuGet u .NET aplikaciji za pretvaranje Word dokumenta u tekst
- Dodajte referencu na imenski prostor GroupDocs.Conversion za razvoj funkcije pretvorbe riječi u tekst
- Instancirajte klasu Converter za učitavanje ulazne Word datoteke
- Inicijalizirajte klasu WordProcessingConvertOptions za definiranje opcija pretvaranja za izlaznu tekstualnu datoteku
- Na kraju pozovite metodu Convert za generiranje teksta iz Worda i pohranite je na disk
U gornjim koracima možete jednostavno stvoriti funkciju konvertiranja riječi u tekst pomoću C# korištenjem nekoliko API poziva. Nakon konfiguriranja paketa i uvoza bitnih prostora imena, klasa Converter omogućuje vam učitavanje Word datoteke za pretvaranje u traženi format. Klasa WordProcessingConvertOptions omogućuje prilagodbu pretvorene tekstualne datoteke, a izlaznu datoteku možete spremiti na disk pozivanjem metode Convert.
Kod za pretvaranje Word dokumenta u tekst u C#
using System; | |
using GroupDocs.Conversion.Options.Convert; | |
namespace ConvertWordDocumentToTextInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to convert Word document to Text using C# | |
{ | |
// Remove the watermark in output Text document by adding license | |
string licensePath = "GroupDocs.Conversion.lic"; | |
GroupDocs.Conversion.License lic = new GroupDocs.Conversion.License(); | |
lic.SetLicense(licensePath); | |
// Load the source Word file for conversion to Text | |
var converter = new GroupDocs.Conversion.Converter("sample.docx"); | |
// Set the conversion options for Text document to customize the output file | |
WordProcessingConvertOptions options = new WordProcessingConvertOptions { | |
Format = GroupDocs.Conversion.FileTypes.WordProcessingFileType.Txt | |
}; | |
// Convert and save the DOCX in TXT format | |
converter.Convert("converted.txt", options); | |
Console.WriteLine("Done"); | |
} | |
} | |
} |
Gornji isječak koda demonstrira implementaciju konvertiranja Worda u TXT u C# slijedeći postupne upute objašnjene u prethodnom odjeljku. Nekoliko redaka koda i nekoliko API poziva koristi se za dovršetak aplikacije za transformaciju dokumenta u navedeni format. Međutim, ovaj primjer koda možete koristiti u svojim projektima kakav jest ili ga izmijeniti kako biste prilagodili konvertirani tekstualni dokument prema svojim specifičnim zahtjevima pomoću objekta WordProcessingConvertOptions.
Razgovarali smo o procesu pretvorbe dokumenta pretvaranja DOCX u TXT format i razvili primjer za to. Nedavno smo objavili članak o promjeni Excela u sliku pomoću C#, pogledajte kako pretvoriti Excel u sliku u C# vodič za više informacija.