Introduction
Aspose.Words FOSS for Python fournit une API simple pour convertir des documents Word entre différents formats. La classe Document charge les fichiers dans cinq formats d’entrée et la méthode save() exporte vers PDF, Markdown ou texte brut.
Ce post parcourt les flux de conversion principaux, de la conversion d’un fichier unique au traitement par lots pour tous les formats pris en charge.
Fonctionnalités clés
Conversion d’un document unique
Chargez n’importe quel fichier d’entrée pris en charge et convertissez-le en un format cible en deux lignes de code. Le constructeur Document accepte les fichiers DOCX, DOC, RTF, TXT et Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Conversion par lots en plusieurs formats
Appelez save() plusieurs fois sur le même document chargé pour produire des sorties dans tous les formats pris en charge sans recharger le fichier d’entrée.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Exportation PDF avec PdfSaveOptions
Utilisez PdfSaveOptions pour un contrôle fin de la sortie PDF. Pour les paramètres par défaut, SaveFormat.PDF suffit.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Exportation Markdown avec MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Extraction de texte
Extrayez le contenu texte brut de tout document chargé à l’aide de Document.get_text() sans écrire dans un fichier.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Démarrage rapide
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Formats pris en charge
| Format | Extension | Lecture | Écriture |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source et licences
Aspose.Words FOSS pour Python est publié sous la licence MIT. Vous pouvez l’utiliser dans des projets personnels, internes et commerciaux sans frais de licence. Le code source est disponible sur GitHub.