Introduzione
Aspose.Words FOSS for Python fornisce un’API semplice per convertire i documenti Word tra i formati. La classe Document carica file in cinque formati di input e il metodo save() esporta in PDF, Markdown o testo semplice.
Questo post illustra i flussi di conversione principali, dalla conversione di un singolo file all’elaborazione batch su tutti i formati supportati.
Caratteristiche principali
Conversione di un documento singolo
Carica qualsiasi file di input supportato e converti in un formato di destinazione con due righe di codice. Il costruttore Document accetta file DOCX, DOC, RTF, TXT e Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Conversione batch in più formati
Esegui save() più volte sullo stesso documento caricato per produrre output in tutti i formati supportati senza ricaricare il file di input.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Esportazione PDF con PdfSaveOptions
Usa PdfSaveOptions per un controllo dettagliato sull’output PDF. Per le impostazioni predefinite, SaveFormat.PDF è sufficiente.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Esportazione Markdown con MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Estrazione del testo
Estrai il contenuto di testo semplice da qualsiasi documento caricato usando Document.get_text() senza scrivere su un file.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Avvio rapido
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Formati supportati
| Formato | Estensione | Lettura | Scrittura |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source e Licenze
Aspose.Words FOSS for Python è rilasciato sotto la Licenza MIT. Puoi usarlo in progetti personali, interni e commerciali senza costi di licenza. Il codice sorgente è disponibile su GitHub.