Hogyan lehet képeket kivonni a PDF-ből a C# segítségével

Ebben az útmutató cikkben bemutatjuk a teljes folyamatot a képek kinyeréséhez a PDF webhelyről C# segítségével, a szükséges könyvtár konfigurálását a képek kinyeréséhez, valamint egy mintakódot a ** megvalósításának bemutatására. C# képek kibontása PDF** alkalmazásból. Ezek az utasítások nem függenek semmilyen további szoftvertől, és használhatók bármilyen operációs rendszeren, például MS Windowson, Linuxon és macOS-en, amelyek támogatják a .NET környezetet.

A képek PDF-ből történő kibontásának lépései C# használatával

  1. Állítsa be a GroupDocs.Parser for .NET csomagot a NuGet csomagkezelőből a .NET projektben a képek PDF-dokumentumból való kinyeréséhez
  2. Adjon hozzá hivatkozást a szükséges névterekre a képek PDF-ből való kivonásához
  3. Hozzon létre egy objektumot a Parser osztályból a bemeneti PDF dokumentum betöltéséhez
  4. Hívja meg a GetImages metódust, és szerezzen be egy képobjektum-gyűjteményt
  5. Végül ismételje meg a gyűjteményt, és kapja meg a méreteket, a képtípusokat és a képtartalmat

A fenti lépésenkénti utasítások könnyen követhetők a extract image from PDF C# alkalmazás fejlesztéséhez a .NET projektekben. Az Parser osztály lehetővé teszi a forrás PDF fájl betöltését a képek kibontásához a szükséges csomag konfigurálása és a lényeges névterek importálása után. Ezután a Parser osztály GetImages metódusa lehetővé teszi a képobjektumok gyűjteményének lekérését és elemzését a kép méretének, típusának és tartalmának kinyeréséhez.

Kód a képek PDF-ből történő kivonásához C# használatával

using System;
using System.Collections.Generic;
using GroupDocs.Parser;
using GroupDocs.Parser.Data;
namespace ExtractImagesFromPdfUsingCSharp
{
class Program
{
public static void Main(string[] args) // Main function to extract images from PDF using C#
{
// Remove the watermark in output
string licensePath = "GroupDocs.Parser.lic";
GroupDocs.Parser.License lic = new GroupDocs.Parser.License();
lic.SetLicense(licensePath);
// Create an instance of Parser class
using (Parser parser = new Parser("sample.pdf"))
{
// Extract images
IEnumerable<PageImageArea> images = parser.GetImages();
// Check if images extraction is supported
if (images == null)
{
Console.WriteLine("Images extraction isn't supported");
return;
}
// Iterate over images
foreach (PageImageArea image in images)
{
// Print a page index, rectangle and image type:
Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType));
}
}
}
}
}

Az előző részletben a get image from PDF C# képességet az előző részben ismertetett utasítások szerint fejlesztettük ki. Amint látja, csak néhány API-hívás kérdése a képek PDF-fájlból való kinyeréséhez. Ezenkívül ez a mintakód adaptálható képek kinyerésére különféle más dokumentumformátumokból, beleértve a DOC, DOCX, XLSX, XLT, HTML, PPT, PPTX, EPUB és sok más formátumot.

Megvitattuk a képek C#-ban történő kinyerésének lépésről lépésre történő folyamatát, és ebben a bejegyzésben mintakódot dolgoztunk ki hozzá. Nemrég közzétettünk egy cikket a PDF-ből C# használatával történő kivonatolásról. További információért tekintse meg a hogyan lehet szöveget kivonni a PDF-ből C#-ban útmutatót.

 Magyar