Skannad PDF till Word OCR csharp

Skannade PDF filer innehåller ofta bilder där texten varken är valbar eller redigerbar. I olika scenarier kan du behöva konvertera en skannad PDF till ett Word-dokument. Denna artikel kommer att vägleda dig genom processen av att konvertera skannade PDF-filer till Word-dokument i antingen DOCX eller DOC format programmässigt med C#.

Innehållsförteckning

Skannad PDF till Word DOCX-konverterare – C# API-installation

För att arbeta med skannade PDF-filer kan du utföra optisk teckenigenkänning (OCR) med hjälp av Aspose.OCR för .NET API. Efter att ha känt igen texten kan du skapa ett Word-dokument med Aspose.Words för .NET API. Du kan installera dessa API:er genom att ladda ner DLL-filerna från Nya versioner eller genom att använda följande NuGet-installationskommandon:

PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words

Konvertera skannad PDF till Word-dokument programmässigt med C#

För att konvertera skannade PDF-filer till Word-dokument behöver du känna igen texten optiskt. OCR-operationerna kommer att konvertera den skannade PDF:en till text, som sedan kan formateras till ett Word-dokument i antingen DOC- eller DOCX-format. Följ dessa steg för att konvertera skannad PDF till ett Word-dokument:

  1. Initiera en instans av AsposeOcr klassen.
  2. Använd DocumentRecognitionSettings klassen för att känna igen bilder från PDF:en.
  3. Skapa ett StringBuilder objekt för att spara den igenkända texten.
  4. Initiera ett Word-dokument med Document klassen.
  5. Ange nödvändig teckensnitt- och styckeformatering.
  6. Spara det utdata Word-dokumentet i antingen DOCX- eller DOC-format.

Här är ett kodexempel som visar hur man konverterar en skannad PDF-fil till ett Word-dokument programmässigt med C#:

Få gratis utvärderingslicens

Du kan testa API:erna till deras fulla kapacitet genom att begära en gratis tillfällig licens.

Slutsats

I den här artikeln har du lärt dig hur man konverterar en skannad PDF-fil till ett Word-dokument i antingen DOCX- eller DOC-format programmässigt med C#. Dessutom kan du utforska olika andra OCR-relaterade funktioner genom att besöka dokumentationen. Om du har några frågor, tveka inte att kontakta oss på forumet.

Se även

Tips: Om du någonsin behöver konvertera en PowerPoint-presentation till ett Word-dokument, överväg att använda Aspose Presentation till Word-dokument konverteraren.

Genom att använda Aspose-plugin kan du effektivt hantera skannade filer och förbättra dina .NET-applikationer för endast $99.