Ebben az útmutató cikkben bemutatjuk a teljes folyamatot a képek kinyeréséhez a PDF webhelyről C# segítségével, a szükséges könyvtár konfigurálását a képek kinyeréséhez, valamint egy mintakódot a ** megvalósításának bemutatására. C# képek kibontása PDF** alkalmazásból. Ezek az utasítások nem függenek semmilyen további szoftvertől, és használhatók bármilyen operációs rendszeren, például MS Windowson, Linuxon és macOS-en, amelyek támogatják a .NET környezetet.
A képek PDF-ből történő kibontásának lépései C# használatával
- Állítsa be a GroupDocs.Parser for .NET csomagot a NuGet csomagkezelőből a .NET projektben a képek PDF-dokumentumból való kinyeréséhez
- Adjon hozzá hivatkozást a szükséges névterekre a képek PDF-ből való kivonásához
- Hozzon létre egy objektumot a Parser osztályból a bemeneti PDF dokumentum betöltéséhez
- Hívja meg a GetImages metódust, és szerezzen be egy képobjektum-gyűjteményt
- Végül ismételje meg a gyűjteményt, és kapja meg a méreteket, a képtípusokat és a képtartalmat
A fenti lépésenkénti utasítások könnyen követhetők a extract image from PDF C# alkalmazás fejlesztéséhez a .NET projektekben. Az Parser osztály lehetővé teszi a forrás PDF fájl betöltését a képek kibontásához a szükséges csomag konfigurálása és a lényeges névterek importálása után. Ezután a Parser osztály GetImages metódusa lehetővé teszi a képobjektumok gyűjteményének lekérését és elemzését a kép méretének, típusának és tartalmának kinyeréséhez.
Kód a képek PDF-ből történő kivonásához C# használatával
using System; | |
using System.Collections.Generic; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractImagesFromPdfUsingCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract images from PDF using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.pdf")) | |
{ | |
// Extract images | |
IEnumerable<PageImageArea> images = parser.GetImages(); | |
// Check if images extraction is supported | |
if (images == null) | |
{ | |
Console.WriteLine("Images extraction isn't supported"); | |
return; | |
} | |
// Iterate over images | |
foreach (PageImageArea image in images) | |
{ | |
// Print a page index, rectangle and image type: | |
Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType)); | |
} | |
} | |
} | |
} | |
} |
Az előző részletben a get image from PDF C# képességet az előző részben ismertetett utasítások szerint fejlesztettük ki. Amint látja, csak néhány API-hívás kérdése a képek PDF-fájlból való kinyeréséhez. Ezenkívül ez a mintakód adaptálható képek kinyerésére különféle más dokumentumformátumokból, beleértve a DOC, DOCX, XLSX, XLT, HTML, PPT, PPTX, EPUB és sok más formátumot.
Megvitattuk a képek C#-ban történő kinyerésének lépésről lépésre történő folyamatát, és ebben a bejegyzésben mintakódot dolgoztunk ki hozzá. Nemrég közzétettünk egy cikket a PDF-ből C# használatával történő kivonatolásról. További információért tekintse meg a hogyan lehet szöveget kivonni a PDF-ből C#-ban útmutatót.