Skannade PDF filer innehåller ofta bilder där texten varken är valbar eller redigerbar. I olika scenarier kan du behöva konvertera en skannad PDF till ett Word-dokument. Denna artikel kommer att vägleda dig genom processen av att konvertera skannade PDF-filer till Word-dokument i antingen DOCX eller DOC format programmässigt med C#.
Innehållsförteckning
- Skannad PDF till Word DOCX-konverterare – C# API-installation
- Konvertera skannad PDF till Word-dokument programmässigt med C#
- Få gratis utvärderingslicens
- Slutsats
- Se även
Skannad PDF till Word DOCX-konverterare – C# API-installation
För att arbeta med skannade PDF-filer kan du utföra optisk teckenigenkänning (OCR) med hjälp av Aspose.OCR för .NET API. Efter att ha känt igen texten kan du skapa ett Word-dokument med Aspose.Words för .NET API. Du kan installera dessa API:er genom att ladda ner DLL-filerna från Nya versioner eller genom att använda följande NuGet-installationskommandon:
PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words
Konvertera skannad PDF till Word-dokument programmässigt med C#
För att konvertera skannade PDF-filer till Word-dokument behöver du känna igen texten optiskt. OCR-operationerna kommer att konvertera den skannade PDF:en till text, som sedan kan formateras till ett Word-dokument i antingen DOC- eller DOCX-format. Följ dessa steg för att konvertera skannad PDF till ett Word-dokument:
- Initiera en instans av AsposeOcr klassen.
- Använd DocumentRecognitionSettings klassen för att känna igen bilder från PDF:en.
- Skapa ett StringBuilder objekt för att spara den igenkända texten.
- Initiera ett Word-dokument med Document klassen.
- Ange nödvändig teckensnitt- och styckeformatering.
- Spara det utdata Word-dokumentet i antingen DOCX- eller DOC-format.
Här är ett kodexempel som visar hur man konverterar en skannad PDF-fil till ett Word-dokument programmässigt med C#:
Få gratis utvärderingslicens
Du kan testa API:erna till deras fulla kapacitet genom att begära en gratis tillfällig licens.
Slutsats
I den här artikeln har du lärt dig hur man konverterar en skannad PDF-fil till ett Word-dokument i antingen DOCX- eller DOC-format programmässigt med C#. Dessutom kan du utforska olika andra OCR-relaterade funktioner genom att besöka dokumentationen. Om du har några frågor, tveka inte att kontakta oss på forumet.
Se även
Tips: Om du någonsin behöver konvertera en PowerPoint-presentation till ett Word-dokument, överväg att använda Aspose Presentation till Word-dokument konverteraren.
Genom att använda Aspose-plugin kan du effektivt hantera skannade filer och förbättra dina .NET-applikationer för endast $99.