Úvod
Aspose.Words FOSS for Python poskytuje jednoduché API na konverziu dokumentov Word medzi formátmi. Trieda Document načítava súbory v piatich vstupných formátoch a metóda save() exportuje do PDF, Markdown alebo obyčajného textu.
Tento príspevok prechádza základnými pracovnými postupmi konverzie, od konverzie jedného súboru po dávkové spracovanie vo všetkých podporovaných formátoch.
Kľúčové vlastnosti
Konverzia jedného dokumentu
Načítajte akýkoľvek podporovaný vstupný súbor a skonvertujte ho do cieľového formátu pomocou dvoch riadkov kódu. Konstruktor Document akceptuje súbory DOCX, DOC, RTF, TXT a Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Dávková konverzia do viacerých formátov
Volajte save() viackrát na tom istom načítanom dokumente, aby ste vytvorili výstupy vo všetkých podporovaných formátoch bez opätovného načítania vstupného súboru.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Export PDF s PdfSaveOptions
Použite PdfSaveOptions pre detailnú kontrolu výstupu PDF. Pre predvolené nastavenia je SaveFormat.PDF dostatočný.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Export Markdown s MarkdownSaveOptions
Použite MarkdownSaveOptions pre ďalšiu kontrolu formátovania výstupu Markdown.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Extrahovanie textu
Extrahujte čistý textový obsah z akéhokoľvek načítaného dokumentu pomocou Document.get_text() bez zápisu do súboru.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Rýchly štart
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Podporované formáty
| Formát | Prípona | Čítať | Zapisovať |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source a licencovanie
Aspose.Words FOSS pre Python je vydaný pod licenciou MIT License. Môžete ho používať v osobných, interných a komerčných projektoch bez licenčných poplatkov. Zdrojový kód je dostupný na GitHub.