이 튜토리얼에서는 최고의 문서 변환기 라이브러리 중 하나를 사용하여 문서 변환을 수행하는 단계별 절차를 설명하고 C#에서 **PDF를 Text로 **변환하는 방법을 배웁니다. 이 가이드에 정의된 프로세스를 사용하여 PDF에서 텍스트로의 변환기 C# 기능을 빠르게 구현할 수 있습니다. 또한 이러한 지침은 타사 소프트웨어를 추가로 필요로 하지 않으며 MS Windows, Linux 및 Mac OS와 같은 모든 운영 체제에서 구현할 수 있습니다.
C#에서 PDF를 텍스트로 변환하는 단계
- PDF to Text 기능을 구현하려면 .NET 프로젝트의 NuGet에서 GroupDocs.Conversion for .NET 패키지를 설치하세요.
- PDF를 텍스트로 변환하려면 GroupDocs.Conversion 네임스페이스에 대한 참조를 추가하세요.
- Converter 클래스의 개체를 만들고 소스 PDF 파일을 생성자에 전달합니다.
- WordProcessingConvertOptions 클래스를 초기화하고 텍스트 문서를 사용자 정의하기 위한 매개변수를 정의합니다.
- 마지막으로 Converter 클래스의 Convert 메서드를 호출하여 PDF를 텍스트 문서로 저장합니다.
이러한 지점에서 C# PDF를 텍스트로 변환 기능을 구현하기 위해 라이브러리를 구성한 후 PDF 파일을 로드하기 위해 Converter 클래스가 시작됩니다. 그런 다음 WordProcessingConvertOptions 클래스를 초기화하여 출력 텍스트 파일을 사용자 지정하기 위한 속성을 설정합니다. 결국 출력 Text 문서는 Convert 메서드를 호출하여 디스크에 저장됩니다.
C#에서 PDF를 텍스트로 변환하는 코드
PDF를 텍스트로 변환 C# 기능은 이전 섹션에서 설명한 지침을 사용하여 위의 스니펫에서 생성됩니다. PDF를 텍스트로 변경하기 위해 문서 변환 라이브러리의 몇 가지 API 호출을 사용했습니다. 또한 다양한 문서를 HTML, CSV, DOCX, DWF, EML, ODT, PNG 등을 포함한 텍스트 형식으로 변환할 수 있습니다.
우리는 C# PDF에서 텍스트 가져오기 기능을 구현하기 위한 문서 변환 프로세스에 집중했습니다. 최근에 C#에서 HTML을 텍스트로 변경하는 기사를 게시했습니다. 자세한 내용은 C#을 사용하여 HTML을 텍스트로 변환하는 방법 가이드를 참조하세요.