Úvod

Aspose.Words FOSS for Python poskytuje jednoduché API na konverziu dokumentov Word medzi formátmi. Trieda Document načítava súbory v piatich vstupných formátoch a metóda save() exportuje do PDF, Markdown alebo obyčajného textu.

Tento príspevok prechádza základnými pracovnými postupmi konverzie, od konverzie jedného súboru po dávkové spracovanie vo všetkých podporovaných formátoch.


Kľúčové vlastnosti

Konverzia jedného dokumentu

Načítajte akýkoľvek podporovaný vstupný súbor a skonvertujte ho do cieľového formátu pomocou dvoch riadkov kódu. Konstruktor Document akceptuje súbory DOCX, DOC, RTF, TXT a Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Dávková konverzia do viacerých formátov

Volajte save() viackrát na tom istom načítanom dokumente, aby ste vytvorili výstupy vo všetkých podporovaných formátoch bez opätovného načítania vstupného súboru.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Export PDF s PdfSaveOptions

Použite PdfSaveOptions pre detailnú kontrolu výstupu PDF. Pre predvolené nastavenia je SaveFormat.PDF dostatočný.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Export Markdown s MarkdownSaveOptions

Použite MarkdownSaveOptions pre ďalšiu kontrolu formátovania výstupu Markdown.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Extrahovanie textu

Extrahujte čistý textový obsah z akéhokoľvek načítaného dokumentu pomocou Document.get_text() bez zápisu do súboru.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Rýchly štart

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Podporované formáty

FormátPríponaČítaťZapisovať
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Open Source a licencovanie

Aspose.Words FOSS pre Python je vydaný pod licenciou MIT License. Môžete ho používať v osobných, interných a komerčných projektoch bez licenčných poplatkov. Zdrojový kód je dostupný na GitHub.


Začíname