Odczyt metadanych z PPTX przy użyciu C#

W dzisiejszej epoce cyfrowej zrozumienie zawiłości danych zawartych w plikach staje się coraz ważniejsze. Metadane, ukryta skarbnica informacji w dokumentach cyfrowych, zawierają cenne informacje czekające na odkrycie. Wśród szerokiej gamy formatów plików PPTX wyróżnia się jako powszechnie używany format prezentacji pełen bogatych metadanych, gotowych do odkrycia i eksploracji. W tym artykule zagłębiamy się w świat programowania, aby odkryć tajniki odczytywania metadanych z PPTX przy użyciu języka C#. Poniżej znajduje się lista kroków wraz z przykładem kodu demonstrującym, jak odczytywać metadane PPTX przy użyciu języka C#.

Kroki, aby odczytać metadane z PPTX przy użyciu C#

  1. Skonfiguruj swój program kodujący tak, aby używał GroupDocs.Metadata for .NET do pobierania informacji z plików PPTX
  2. Utwórz instancję obiektu Metadata, podając ścieżkę pliku PPTX jako argument jego konstruktorowi
  3. Utwórz reguły, aby sprawdzić wszystkie zebrane szczegóły metadanych
  4. Zdefiniuj warunek dla metody Metadata.FindProperties
  5. Przejrzyj wszystkie znalezione nieruchomości, jedna po drugiej

Metadane, mówiąc najprościej, to dane o danych. Obejmuje szeroki zakres informacji, takich jak dane autora, data utworzenia, data ostatniej modyfikacji i wiele innych. W kontekście plików PPTX metadane mogą ujawnić kluczowe informacje na temat prezentacji, w tym jej pochodzenie, wersje i strukturę treści. Aby wykorzystać możliwości ekstrakcji metadanych z plików PPTX, korzystamy z C#, wszechstronnego i wydajnego języka programowania, oraz GroupDocs.Metadata, solidnej biblioteki do pracy z metadanymi w aplikacjach .NET. Ta biblioteka upraszcza proces uzyskiwania dostępu i manipulowania metadanymi w różnych formatach plików, w tym PPTX. Poniższy przykład kodu pokazuje, jak wyodrębnić metadane PPTX w C#.

Kod do odczytu metadanych z PPTX przy użyciu C#

using GroupDocs.Metadata;
using GroupDocs.Metadata.Common;
using GroupDocs.Metadata.Tagging;
using System.Text.RegularExpressions;
namespace ReadMetadataFromPPTXUsingCSharp
{
internal class Program
{
static void Main(string[] args)
{
// Set License to avoid the limitations of Metadata library
License lic = new License();
lic.SetLicense(@"GroupDocs.Metadata.lic");
// Pass absolute or relative path of document to Metadata's constructor
using (Metadata metadata = new Metadata(@"input.pptx"))
{
if (metadata.FileFormat != FileFormat.Unknown && !metadata.GetDocumentInfo().IsEncrypted)
{
Console.WriteLine();
// Fetch all metadata properties that fall into a particular category
var properties = metadata.FindProperties(p => p.Tags.Any(t => t.Category == Tags.Content));
Console.WriteLine("The metadata properties describing some characteristics of the file content: title, keywords, language, etc.");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties having a specific type and value
var year = DateTime.Today.Year;
properties = metadata.FindProperties(p => p.Value.Type == MetadataPropertyType.DateTime &&
p.Value.ToStruct(DateTime.MinValue).Year == year);
Console.WriteLine("All datetime properties with the year value equal to the current year");
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
// Fetch all properties whose names match the specified regex
const string pattern = "^author|company|(.+date.*)$";
Regex regex = new Regex(pattern, RegexOptions.IgnoreCase);
properties = metadata.FindProperties(p => regex.IsMatch(p.Name));
Console.WriteLine("All properties whose names match the following regex: {0}", pattern);
foreach (var property in properties)
{
Console.WriteLine("{0} = {1}", property.Name, property.Value);
}
}
}
}
}
}

Postępowanie zgodnie z podanymi instrukcjami umożliwi uzyskanie metadanych PPTX w języku C# na popularnych systemach, takich jak Windows, macOS i Linux, pod warunkiem, że masz zainstalowaną platformę .NET. Nie ma potrzeby instalowania dodatkowego oprogramowania. Podsumowując, odblokowanie ukrytych skarbów metadanych w plikach PPTX przy użyciu języka C# jest satysfakcjonującym przedsięwzięciem. Wykorzystując możliwości sugerowanej biblioteki i wszechstronność języka C#, programiści mogą odkryć bezcenne spostrzeżenia ukryte w prezentacjach cyfrowych. Po skonfigurowaniu zalecanej biblioteki i dostosowaniu ścieżek plików zgodnie z wymaganiami, integracja poniższego kodu z projektami powinna przebiegać płynnie i bez żadnych problemów.

W naszej wcześniejszej rozmowie zaoferowaliśmy szczegółowy przewodnik na temat wyodrębniania metadanych z plików XLSX przy użyciu języka C#. Aby lepiej zrozumieć ten temat, sugerujemy zapoznanie się z naszym obszernym samouczkiem na temat odczytaj metadane z XLSX za pomocą C#.

 Polski