스캔된 PDF에서 Excel로 OCR

스캔된 PDF 파일은 종종 이미지 형식으로 데이터를 포함하고 있어 정보 추출을 복잡하게 만들 수 있습니다. 이러한 문서에서 숫자 정보를 Excel에서 조작해야 하는 경우 광학 문자 인식(OCR)이 해결책입니다. 이 문서에서는 C#을 사용하여 스캔된 PDF를 Excel로 변환하는 변환기를 만드는 방법을 안내합니다.

목차

OCR을 사용한 스캔된 PDF에서 Excel 변환기를 위한 C# API 설치

스캔된 PDF를 Excel로 변환하는 데 필요한 OCR 기능을 활용하려면 Aspose.OCR for .NET API를 사용할 수 있습니다. 프로젝트 설정은 간단합니다: New Releases 섹션에서 DLL을 다운로드하거나 다음 명령어를 사용하여 NuGet을 통해 설치합니다:

PM> Install-Package Aspose.OCR

C#에서 스캔된 PDF를 Excel로 프로그래밍 방식으로 변환

다음 단계에 따라 스캔된 PDF 문서를 Excel 파일로 변환합니다:

  1. AsposeOcr 클래스 객체를 인스턴스화합니다.
  2. DocumentRecognitionSettings 클래스 객체를 지정합니다.
  3. RecognizePdf 메서드를 사용하여 스캔된 PDF 파일을 인식합니다.
  4. SaveMultipageDocument 메서드를 사용하여 출력 Excel 파일을 저장합니다.

다음은 C#을 사용하여 스캔된 PDF를 Excel로 변환하는 방법을 보여주는 코드 샘플입니다:

무료 평가 라이센스 받기

스캔된 PDF를 Excel로 변환하는 전체 기능을 탐색하려면 무료 임시 라이센스를 요청할 수 있습니다. 이를 통해 제한 없이 기능을 평가할 수 있습니다.

결론

이 문서에서는 OCR을 적용하여 스캔된 PDF 파일을 Excel로 변환하는 방법을 다루었습니다. 이 과정은 Excel에서 조작해야 하는 스캔된 문서를 다룰 때 특히 유용합니다. C#을 사용하여 스캔된 PDF에서 데이터를 효율적으로 추출하고 Excel 스프레드시트를 생성할 수 있습니다. API에서 제공하는 OCR 기능에 대한 추가 탐색은 문서를 참조하세요. 질문이 있는 경우 포럼에서 문의해 주십시오.

참고

최고의 C# OCR 라이브러리를 활용하여 Excel 변환을 통해 OCR PDF에서 Excel 작업의 높은 정확도를 달성할 수 있습니다. PDF를 Excel로 변환하는 .NET 애플리케이션을 개발하든 .NET Core PDF OCR Excel 변환을 탐색하든, Aspose 플러그인은 원활한 통합을 위한 도구를 제공합니다. 단 $99에 C#으로 OCR 기능이 있는 강력한 PDF에서 Excel 변환기를 구축하여 생산성을 크게 향상시킬 수 있습니다.