Introduktion
Aspose.Words FOSS är ett open-source Python‑bibliotek för att arbeta med Word‑dokument. Det läser DOCX-, DOC-, RTF-, TXT- och Markdown‑filer och kan exportera dem till PDF, Markdown eller vanlig text — allt utan att kräva Microsoft Word eller några inhemska beroenden.
Biblioteket är släppt under MIT-licensen och finns tillgängligt på PyPI. Installera det med:
pip install aspose-words-foss>=26.4.0
Aspose.Words FOSS kräver Python 3.10 eller senare och är beroende av tre rena Python-paket (olefile, fpdf2, pydantic), som installeras automatiskt av pip.
Nyckelfunktioner
Dokumentladdning och konvertering
Klassen Document är den primära ingångspunkten. Ladda en fil i något av de stödda inmatningsformaten och anropa save() för att konvertera den till ett annat utdataformat.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)
PDF‑export
Exportera Word-dokument till PDF med SaveFormat.PDF för standardinställningar eller PdfSaveOptions för finjusterad kontroll.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Markdown-export med sparalternativ
Använd MarkdownSaveOptions och PdfSaveOptions för finjusterad kontroll över utdataformatering.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions, PdfSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Textutdrag
Extrahera ren text från alla stödda dokumentformat med Document.get_text().
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
Dokumentstrukturparsing
Specialiserade parser extraherar strukturerad data från DOCX-interna. NumberingParser läser listnumreringsdefinitioner och StyleParser analyserar stilnamn till strukturerade objekt.
Stöd för inmatning i flera format
Läs in dokument från fem inmatningsformat — DOCX, DOC, RTF, TXT och Markdown — med samma Document-konstruktor. LoadFormat-enumerationen tillhandahåller konstanter för explicit formatval (LoadFormat.DOCX, LoadFormat.DOC, LoadFormat.RTF, LoadFormat.TEXT, LoadFormat.MARKDOWN).
Snabbstart
Installera paketet och konvertera en DOCX‑fil till alla tre utdataformat:
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("report.docx")
# Export to Markdown
doc.save("report.md", aw.SaveFormat.MARKDOWN)
# Export to PDF
doc.save("report.pdf", aw.SaveFormat.PDF)
# Export to plain text
doc.save("report.txt", aw.SaveFormat.TEXT)
# Extract text directly
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Stödda format
| Format | Filändelse | Läs | Skriv |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Öppen källkod & licensiering
Aspose.Words FOSS for Python är släppt under MIT License. Du kan använda den fritt i personliga, interna och kommersiella projekt utan licensavgifter. Den fullständiga källkoden finns tillgänglig på GitHub hos Aspose Words FOSS organization.