Úvod

Aspose.Words FOSS for Python poskytuje jednoduché API pro převod dokumentů Word mezi formáty. Třída Document načítá soubory v pěti vstupních formátech a metoda save() exportuje do PDF, Markdown nebo prostého textu.

Tento příspěvek provádí průvodce hlavními konverzními workflow, od konverze jednoho souboru po dávkové zpracování napříč všemi podporovanými formáty.


Klíčové vlastnosti

Konverze jednoho dokumentu

Načtěte libovolný podporovaný vstupní soubor a převeďte jej do cílového formátu pomocí dvou řádků kódu. Konstruktor Document přijímá soubory DOCX, DOC, RTF, TXT a Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Dávková konverze do více formátů

Zavolejte save() vícekrát na stejném načteném dokumentu, abyste vytvořili výstupy ve všech podporovaných formátech, aniž byste znovu načítali vstupní soubor.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Export PDF s PdfSaveOptions

Použijte PdfSaveOptions pro jemnou kontrolu výstupu PDF. Pro výchozí nastavení je SaveFormat.PDF dostačující.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Export Markdown s MarkdownSaveOptions

Použijte MarkdownSaveOptions pro další kontrolu formátování výstupu Markdownu.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Extrahování textu

Extrahujte prostý textový obsah z libovolného načteného dokumentu pomocí Document.get_text() bez zápisu do souboru.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Rychlý start

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Podporované formáty

FormátPříponaČteníZápis
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Open Source a licencování

Aspose.Words FOSS pro Python je vydán pod licencí MIT. Můžete jej používat v osobních, interních i komerčních projektech bez licenčních poplatků. Zdrojový kód je k dispozici na GitHubu.


Začínáme