Zeskanowane pliki PDF często zawierają obrazy, w których tekst nie jest ani zaznaczany, ani edytowany. W różnych scenariuszach może być konieczne skonwertowanie zeskanowanego PDF na dokument Word. Ten artykuł poprowadzi Cię przez proces programowego konwertowania zeskanowanych plików PDF na dokumenty Word w formacie DOCX lub DOC za pomocą C#.
Spis treści
- Konwerter zeskanowanego PDF na Word DOCX – Instalacja API C#
- Programowa konwersja zeskanowanego PDF na dokument Word za pomocą C#
- Uzyskaj darmową licencję ewaluacyjną
- Podsumowanie
- Zobacz także
Konwerter zeskanowanego PDF na Word DOCX – Instalacja API C#
Aby pracować z zeskanowanymi plikami PDF, możesz wykonać rozpoznawanie znaków optycznych (OCR) za pomocą API Aspose.OCR dla .NET. Po rozpoznaniu tekstu możesz utworzyć dokument Word za pomocą API Aspose.Words dla .NET. Możesz zainstalować te API, pobierając pliki DLL z sekcji Nowe wydania lub używając następujących poleceń instalacji NuGet:
PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words
Programowa konwersja zeskanowanego PDF na dokument Word za pomocą C#
Aby skonwertować zeskanowane pliki PDF na dokumenty Word, musisz optycznie rozpoznać tekst. Operacje OCR przekształcą zeskanowany PDF w tekst, który następnie można sformatować w dokumencie Word w formacie DOC lub DOCX. Wykonaj te kroki, aby skonwertować zeskanowany PDF na dokument Word:
- Zainicjalizuj instancję klasy AsposeOcr.
- Użyj klasy DocumentRecognitionSettings, aby rozpoznać obrazy z PDF.
- Utwórz obiekt StringBuilder, aby zapisać rozpoznany tekst.
- Zainicjalizuj dokument Word przy użyciu klasy Document.
- Określ niezbędne formatowanie czcionki i akapitu.
- Zapisz wyjściowy dokument Word w formacie DOCX lub DOC.
Oto fragment kodu ilustrujący, jak programowo skonwertować zeskanowany plik PDF na dokument Word za pomocą C#:
Uzyskaj darmową licencję ewaluacyjną
Możesz przetestować API w pełni, żądając darmowej tymczasowej licencji.
Podsumowanie
W tym artykule dowiedziałeś się, jak programowo skonwertować zeskanowany plik PDF na dokument Word w formacie DOCX lub DOC za pomocą C#. Dodatkowo możesz odkryć różne inne funkcje związane z OCR, odwiedzając dokumentację. Jeśli masz jakiekolwiek pytania, nie wahaj się z nami skontaktować na forum.
Zobacz także
Wskazówka: Jeśli kiedykolwiek będziesz musiał skonwertować prezentację PowerPoint na dokument Word, rozważ użycie konwertera Aspose Prezentacja na dokument Word.
Korzystając z wtyczki Aspose, możesz skutecznie zarządzać zeskanowanymi plikami i ulepszać swoje aplikacje .NET za jedynie 99 USD.