Naskenované PDF soubory často obsahují obrázky, kde text není ani výběrový, ani editovatelný. V různých scénářích můžete potřebovat převést naskenované PDF na Word dokument. Tento článek vás provede procesem převodu naskenovaných PDF souborů na Word dokumenty buď ve formátu DOCX nebo DOC programově pomocí C#.
Obsah
- Naskenovaný PDF na Word DOCX konvertor – Instalace C# API
- Programově převést naskenované PDF na Word dokument pomocí C#
- Získejte bezplatnou zkušební licenci
- Závěr
- Viz také
Naskenovaný PDF na Word DOCX konvertor – Instalace C# API
Pro práci s naskenovanými PDF soubory můžete provádět optické rozpoznávání znaků (OCR) pomocí Aspose.OCR pro .NET API. Po rozpoznání textu můžete vytvořit Word dokument pomocí Aspose.Words pro .NET API. Tyto API můžete nainstalovat stažením DLL souborů z Nových verzí nebo použitím následujících příkazů pro instalaci NuGet:
PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words
Programově převést naskenované PDF na Word dokument pomocí C#
Pro převod naskenovaných PDF souborů na Word dokumenty budete potřebovat opticky rozpoznat text. Operace OCR převedou naskenované PDF na text, který lze následně naformátovat do Word dokumentu ve formátu DOC nebo DOCX. Postupujte podle těchto kroků pro převod naskenovaného PDF na Word dokument:
- Inicializujte instanci třídy AsposeOcr.
- Použijte třídu DocumentRecognitionSettings k rozpoznání obrázků z PDF.
- Vytvořte objekt StringBuilder pro uložení rozpoznaného textu.
- Inicializujte Word dokument pomocí třídy Document.
- Určete potřebné formátování písma a odstavců.
- Uložte výstupní Word dokument ve formátu DOCX nebo DOC.
Zde je ukázka kódu, která demonstruje, jak programově převést naskenovaný PDF soubor na Word dokument pomocí C#:
Získejte bezplatnou zkušební licenci
Můžete testovat API na jejich plnou kapacitu tím, že si požádáte o bezplatnou dočasnou licenci.
Závěr
V tomto článku jste se naučili, jak programově převést naskenovaný PDF soubor na Word dokument buď ve formátu DOCX nebo DOC pomocí C#. Kromě toho můžete prozkoumat různé další funkce související s OCR návštěvou dokumentace. Pokud máte jakékoli dotazy, neváhejte nás kontaktovat na fóru.
Viz také
Tip: Pokud někdy potřebujete převést prezentaci PowerPoint na Word dokument, zvažte použití Aspose Převodník prezentace na Word dokument.
Pomocí Aspose Pluginu můžete efektivně spravovat naskenované soubory a vylepšit své .NET aplikace za pouhých 99 $.