Introduktion

Aspose.Words FOSS är ett open-source Python‑bibliotek för att arbeta med Word‑dokument. Det läser DOCX-, DOC-, RTF-, TXT- och Markdown‑filer och kan exportera dem till PDF, Markdown eller vanlig text — allt utan att kräva Microsoft Word eller några inhemska beroenden.

Biblioteket är släppt under MIT-licensen och finns tillgängligt på PyPI. Installera det med:

pip install aspose-words-foss>=26.4.0

Aspose.Words FOSS kräver Python 3.10 eller senare och är beroende av tre rena Python-paket (olefile, fpdf2, pydantic), som installeras automatiskt av pip.


Nyckelfunktioner

Dokumentladdning och konvertering

Klassen Document är den primära ingångspunkten. Ladda en fil i något av de stödda inmatningsformaten och anropa save() för att konvertera den till ett annat utdataformat.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

PDF‑export

Exportera Word-dokument till PDF med SaveFormat.PDF för standardinställningar eller PdfSaveOptions för finjusterad kontroll.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Markdown-export med sparalternativ

Använd MarkdownSaveOptions och PdfSaveOptions för finjusterad kontroll över utdataformatering.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions, PdfSaveOptions

doc = aw.Document("input.docx")

md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Textutdrag

Extrahera ren text från alla stödda dokumentformat med Document.get_text().

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Dokumentstrukturparsing

Specialiserade parser extraherar strukturerad data från DOCX-interna. NumberingParser läser listnumreringsdefinitioner och StyleParser analyserar stilnamn till strukturerade objekt.

Stöd för inmatning i flera format

Läs in dokument från fem inmatningsformat — DOCX, DOC, RTF, TXT och Markdown — med samma Document-konstruktor. LoadFormat-enumerationen tillhandahåller konstanter för explicit formatval (LoadFormat.DOCX, LoadFormat.DOC, LoadFormat.RTF, LoadFormat.TEXT, LoadFormat.MARKDOWN).


Snabbstart

Installera paketet och konvertera en DOCX‑fil till alla tre utdataformat:

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("report.docx")

# Export to Markdown
doc.save("report.md", aw.SaveFormat.MARKDOWN)

# Export to PDF
doc.save("report.pdf", aw.SaveFormat.PDF)

# Export to plain text
doc.save("report.txt", aw.SaveFormat.TEXT)

# Extract text directly
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Stödda format

FormatFiländelseLäsSkriv
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Öppen källkod & licensiering

Aspose.Words FOSS for Python är släppt under MIT License. Du kan använda den fritt i personliga, interna och kommersiella projekt utan licensavgifter. Den fullständiga källkoden finns tillgänglig på GitHub hos Aspose Words FOSS organization.


Kom igång