Úvod
Aspose.Words FOSS for Python poskytuje jednoduché API pro převod dokumentů Word mezi formáty. Třída Document načítá soubory v pěti vstupních formátech a metoda save() exportuje do PDF, Markdown nebo prostého textu.
Tento příspěvek provádí průvodce hlavními konverzními workflow, od konverze jednoho souboru po dávkové zpracování napříč všemi podporovanými formáty.
Klíčové vlastnosti
Konverze jednoho dokumentu
Načtěte libovolný podporovaný vstupní soubor a převeďte jej do cílového formátu pomocí dvou řádků kódu. Konstruktor Document přijímá soubory DOCX, DOC, RTF, TXT a Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Dávková konverze do více formátů
Zavolejte save() vícekrát na stejném načteném dokumentu, abyste vytvořili výstupy ve všech podporovaných formátech, aniž byste znovu načítali vstupní soubor.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Export PDF s PdfSaveOptions
Použijte PdfSaveOptions pro jemnou kontrolu výstupu PDF. Pro výchozí nastavení je SaveFormat.PDF dostačující.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Export Markdown s MarkdownSaveOptions
Použijte MarkdownSaveOptions pro další kontrolu formátování výstupu Markdownu.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Extrahování textu
Extrahujte prostý textový obsah z libovolného načteného dokumentu pomocí Document.get_text() bez zápisu do souboru.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Rychlý start
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Podporované formáty
| Formát | Přípona | Čtení | Zápis |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source a licencování
Aspose.Words FOSS pro Python je vydán pod licencí MIT. Můžete jej používat v osobních, interních i komerčních projektech bez licenčních poplatků. Zdrojový kód je k dispozici na GitHubu.