Einleitung

Aspose.Words FOSS for Python bietet eine unkomplizierte API zum Konvertieren von Word‑Dokumenten zwischen Formaten. Die Document‑Klasse lädt Dateien in fünf Eingabeformaten und die save()‑Methode exportiert nach PDF, Markdown oder Klartext.

Dieser Beitrag führt durch die Kernkonvertierungsabläufe, von der Einzeldateikonvertierung bis zur Batch‑Verarbeitung über alle unterstützten Formate.


Hauptmerkmale

Einzelne Dokumentkonvertierung

Laden Sie jede unterstützte Eingabedatei und konvertieren Sie sie mit zwei Codezeilen in ein Zielformat. Der Document‑Konstruktor akzeptiert DOCX-, DOC-, RTF-, TXT- und Markdown‑Dateien.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Batch-Konvertierung in mehrere Formate

Rufen Sie save() mehrfach für dasselbe geladene Dokument auf, um Ausgaben in allen unterstützten Formaten zu erzeugen, ohne die Eingabedatei erneut zu laden.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

PDF-Export mit PdfSaveOptions

Verwenden Sie PdfSaveOptions für eine feinkörnige Steuerung der PDF‑Ausgabe. Für Standardeinstellungen ist SaveFormat.PDF ausreichend.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Markdown-Export mit MarkdownSaveOptions

Verwenden Sie MarkdownSaveOptions für zusätzliche Kontrolle über die Markdown‑Ausgabeformatierung.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Textextraktion

Extrahieren Sie den Klartextinhalt aus jedem geladenen Dokument mithilfe von Document.get_text(), ohne in eine Datei zu schreiben.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Schnellstart

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Unterstützte Formate

FormatExtensionLesenSchreiben
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Open Source & Lizenzierung

Aspose.Words FOSS for Python wird unter der MIT-Lizenz veröffentlicht. Sie können es in privaten, internen und kommerziellen Projekten ohne Lizenzgebühren nutzen. Der Quellcode ist auf GitHub verfügbar.


Erste Schritte