Arquivos PDF escaneados frequentemente contêm imagens onde o texto não é selecionável nem editável. Em várias situações, você pode precisar converter um PDF escaneado para um documento Word. Este artigo irá guiá-lo pelo processo de converter arquivos PDF escaneados em documentos Word nos formatos DOCX ou DOC programaticamente usando C#.
Índice
- Conversor de PDF Escaneado para Word DOCX – Instalação da API C#
- Converter PDF Escaneado para Documento Word Programaticamente usando C#
- Obter Licença de Avaliação Gratuita
- Conclusão
- Veja Também
Conversor de PDF Escaneado para Word DOCX – Instalação da API C#
Para trabalhar com arquivos PDF escaneados, você pode realizar Reconhecimento Óptico de Caracteres (OCR) usando a API Aspose.OCR for .NET. Após reconhecer o texto, você pode criar um documento Word usando a API Aspose.Words for .NET. Você pode instalar essas APIs baixando os arquivos DLL da Nova Versão ou utilizando os seguintes comandos de instalação do NuGet:
PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words
Converter PDF Escaneado para Documento Word Programaticamente usando C#
Para converter arquivos PDF escaneados em documentos Word, você precisará reconhecer o texto opticamente. As operações de OCR irão converter o PDF escaneado em texto, que pode então ser formatado em um documento Word nos formatos DOC ou DOCX. Siga estas etapas para converter PDF escaneado em um documento Word:
- Inicialize uma instância da classe AsposeOcr.
- Use a classe DocumentRecognitionSettings para reconhecer imagens do PDF.
- Crie um objeto StringBuilder para salvar o texto reconhecido.
- Inicialize um documento Word usando a classe Document.
- Especifique a formatação de fonte e parágrafo necessárias.
- Salve o documento Word de saída nos formatos DOCX ou DOC.
Aqui está um trecho de código demonstrando como converter um arquivo PDF escaneado em um documento Word programaticamente usando C#:
Obter Licença de Avaliação Gratuita
Você pode testar as APIs em sua totalidade solicitando uma licença temporária gratuita.
Conclusão
Neste artigo, você aprendeu como converter um arquivo PDF escaneado em um documento Word nos formatos DOCX ou DOC programaticamente usando C#. Além disso, você pode explorar várias outras funcionalidades relacionadas a OCR visitando a documentação. Se você tiver alguma dúvida, fique à vontade para entrar em contato conosco no fórum.
Veja Também
Dica: Se você precisar converter uma apresentação do PowerPoint em um documento Word, considere usar o conversor Aspose Apresentação para Documento Word.
Ao utilizar o Plugin Aspose, você pode gerenciar arquivos escaneados de forma eficaz e aprimorar suas aplicações .NET por apenas $99.