Einleitung
Aspose.Words FOSS for Python bietet eine unkomplizierte API zum Konvertieren von Word‑Dokumenten zwischen Formaten. Die Document‑Klasse lädt Dateien in fünf Eingabeformaten und die save()‑Methode exportiert nach PDF, Markdown oder Klartext.
Dieser Beitrag führt durch die Kernkonvertierungsabläufe, von der Einzeldateikonvertierung bis zur Batch‑Verarbeitung über alle unterstützten Formate.
Hauptmerkmale
Einzelne Dokumentkonvertierung
Laden Sie jede unterstützte Eingabedatei und konvertieren Sie sie mit zwei Codezeilen in ein Zielformat. Der Document‑Konstruktor akzeptiert DOCX-, DOC-, RTF-, TXT- und Markdown‑Dateien.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Batch-Konvertierung in mehrere Formate
Rufen Sie save() mehrfach für dasselbe geladene Dokument auf, um Ausgaben in allen unterstützten Formaten zu erzeugen, ohne die Eingabedatei erneut zu laden.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PDF-Export mit PdfSaveOptions
Verwenden Sie PdfSaveOptions für eine feinkörnige Steuerung der PDF‑Ausgabe. Für Standardeinstellungen ist SaveFormat.PDF ausreichend.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Markdown-Export mit MarkdownSaveOptions
Verwenden Sie MarkdownSaveOptions für zusätzliche Kontrolle über die Markdown‑Ausgabeformatierung.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Textextraktion
Extrahieren Sie den Klartextinhalt aus jedem geladenen Dokument mithilfe von Document.get_text(), ohne in eine Datei zu schreiben.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Schnellstart
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Unterstützte Formate
| Format | Extension | Lesen | Schreiben |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source & Lizenzierung
Aspose.Words FOSS for Python wird unter der MIT-Lizenz veröffentlicht. Sie können es in privaten, internen und kommerziellen Projekten ohne Lizenzgebühren nutzen. Der Quellcode ist auf GitHub verfügbar.