Introduksjon
Aspose.Words FOSS for Python gir et enkelt API for konvertering av Word-dokumenter mellom formater. Document-klassen laster filer i fem inndataformater, og save()-metoden eksporterer til PDF, Markdown eller ren tekst.
Dette innlegget går gjennom de viktigste konverteringsarbeidsflytene, fra enkeltfilkonvertering til batchbehandling på tvers av alle støttede formater.
Nøkkelfunksjoner
Enkelt dokumentkonvertering
Last inn en hvilken som helst støttet inndatafil og konverter den til et målformat med to linjer kode. Document‑konstruktøren godtar DOCX, DOC, RTF, TXT og Markdown‑filer.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Batchkonvertering til flere formater
Kall save() flere ganger på det samme innlastede dokumentet for å produsere utdata i alle støttede formater uten å laste inn filen på nytt.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PDF‑eksport med PdfSaveOptions
Bruk PdfSaveOptions for finjustert kontroll over PDF‑utdata. For standardinnstillinger er SaveFormat.PDF tilstrekkelig.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Markdown-eksport med MarkdownSaveOptions
Bruk MarkdownSaveOptions for ekstra kontroll over Markdown‑utdataformatet.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Tekstuttrekk
Ekstraher ren tekstinnhold fra ethvert lastet dokument ved hjelp av Document.get_text() uten å skrive til en fil.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Rask start
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Støttede formater
| Format | Extension | Les | Skriv |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source og lisensiering
Aspose.Words FOSS for Python er utgitt under MIT License. Du kan bruke den i personlige, interne og kommersielle prosjekter uten lisensavgifter. Kildekoden er tilgjengelig på GitHub.