Ovaj kratki vodič fokusira se na postupak ekstrahiranja metapodataka iz Excel datoteke u C#. Provest ćemo vas kroz svaki korak ekstrakcije metapodataka iz dokumenata pomoću jednog od najboljih API-ja za ekstrakciju dokumenata i naučiti vas kako koristiti ove upute za izradu aplikacije C# Excel metapodataka. Ovdje su ključne točke, kao i isječak koda za dobivanje metapodataka programa Excel pomoću C#.
Koraci za izdvajanje metapodataka iz Excel datoteke u C#
- Instalirajte paket GroupDocs.Parser for .NET s web stranice NuGet u .NET projektu da izvučete metapodatke iz Excel datoteke
- Dodajte referencu potrebnih imenskih prostora za izdvajanje metapodataka iz Excel dokumenta
- Inicijalizirajte klasu Parser za učitavanje ulaznog Excel dokumenta
- Pozovite metodu GetMetadata klase Parser za dobivanje zbirke objekata metapodataka dokumenta
- Iterirajte kroz zbirku metapodataka, prikažite naziv i vrijednost stavke metapodataka
Za dobivanje metapodataka Excel datoteke pomoću C# vrlo je jednostavan postupak slijedeći gornje korake u nizu. Ovi vam koraci objašnjavaju kako konfigurirati potrebni paket, uključiti bitne prostore imena i potrošiti nekoliko API poziva za izdvajanje metapodataka iz Excel dokumenata. Ove se upute ne oslanjaju ni na jedan alat treće strane i možete ih koristiti na svim široko korištenim operativnim sustavima kao što su Windows, macOS i Linux.
Kod za izdvajanje metapodataka iz Excel datoteke u C#
using System; | |
using System.Collections.Generic; | |
using GroupDocs.Parser; | |
using GroupDocs.Parser.Data; | |
namespace ExtractMetadataFromExcelFileInCSharp | |
{ | |
class Program | |
{ | |
public static void Main(string[] args) // Main function to extract Metadata from Excel using C# | |
{ | |
// Remove the watermark in output | |
string licensePath = "GroupDocs.Parser.lic"; | |
GroupDocs.Parser.License lic = new GroupDocs.Parser.License(); | |
lic.SetLicense(licensePath); | |
// Create an instance of Parser class | |
using (Parser parser = new Parser("sample.xlsx")) | |
{ | |
// Extract metadata from the document | |
IEnumerable<MetadataItem> metadata = parser.GetMetadata(); | |
// Check if metadata extraction is supported | |
if(metadata == null) | |
{ | |
Console.WriteLine("Metatada extraction isn't supported"); | |
} | |
// Iterate over metadata items | |
foreach(MetadataItem item in metadata) | |
{ | |
// Print an item name and value | |
Console.WriteLine(string.Format("{0}: {1}", item.Name, item.Value)); | |
} | |
} | |
} | |
} | |
} |
Gornji isječak koda pokazuje kako dobiti XLSX metapodatke u C# korištenjem postupnih uputa objašnjenih u prethodnom odjeljku. Kao što vidite da smo napisali nekoliko redaka koda i potrošili nekoliko API poziva za izdvajanje metapodataka. Također možete izdvojiti metapodatke iz drugih formata dokumenata kao što su DOC, DOCX, DOT, PPTX, PDF, EML, MSG, POT i mnogi drugi.
Raspravljali smo o procesu izdvajanja metapodataka iz Excel dokumenata pomoću C# i razvili primjer koda za to u ovom postu. Nedavno smo objavili članak o izdvajanju slika iz Word dokumenta pomoću C#, pogledajte kako izvući slike iz Word dokumenta u C# vodič za više informacija.