Johdanto
Aspose.Words FOSS for Python tarjoaa suoraviivaisen API:n Word-asiakirjojen muuntamiseen eri formaattien välillä. Document-luokka lataa tiedostoja viidessä syötteen muodossa ja save()-menetelmä vie ne PDF-, Markdown- tai tavalliseen tekstiin.
Tässä julkaisussa käydään läpi ydinkonversioprosessit, yksittäistiedostojen muunnoksesta eräprosessointiin kaikissa tuetuissa formaateissa.
Keskeiset ominaisuudet
Yhden asiakirjan muuntaminen
Lataa mikä tahansa tuettu syötetiedosto ja muunna se kohdeformaattiin kahdella koodirivillä. Document-konstruktori hyväksyy DOCX-, DOC-, RTF-, TXT- ja Markdown-tiedostot.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Erämuunnos useisiin formaatteihin
Kutsu save() useita kertoja samassa ladatussa asiakirjassa tuottaaksesi tulosteita kaikissa tuetuissa formaateissa lataamatta syötetiedostoa uudelleen.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PDF‑vienti PdfSaveOptionsilla
Käytä PdfSaveOptions tarkkaan PDF‑tulosteen hallintaan. Oletusasetuksiin SaveFormat.PDF riittää.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Markdown‑vienti MarkdownSaveOptionsilla
Käytä MarkdownSaveOptions lisäohjausta Markdown‑tulosteen muotoiluun.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Tekstin poiminta
Poimi tavallisen tekstisisällön mistä tahansa ladatusta asiakirjasta käyttämällä Document.get_text() ilman, että kirjoitat tiedostoon.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Pika-aloitus
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Tuetut tiedostomuodot
| Muoto | Tiedostopääte | Luku | Kirjoitus |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Avoin lähdekoodi ja lisensointi
Aspose.Words FOSS for Python on julkaistu MIT License -lisenssin alla. Voit käyttää sitä henkilökohtaisissa, sisäisissä ja kaupallisissa projekteissa ilman lisenssimaksuja. Lähdekoodi on saatavilla GitHubissa.