Introduktion

Aspose.Words FOSS for Python leverer en ligetil API til at konvertere Word-dokumenter mellem formater. Document-klassen indlæser filer i fem inputformater, og save()-metoden eksporterer til PDF, Markdown eller almindelig tekst.

Dette indlæg gennemgår de grundlæggende konverteringsarbejdsgange, fra enkeltfilkonvertering til batchbehandling på tværs af alle understøttede formater.


Nøglefunktioner

Enkelt dokumentkonvertering

Indlæs en hvilken som helst understøttet inputfil og konverter den til et målformat med to linjer kode. Document-konstruktøren accepterer DOCX, DOC, RTF, TXT og Markdown-filer.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Batchkonvertering til flere formater

Kald save() flere gange på det samme indlæste dokument for at producere output i alle understøttede formater uden at genindlæse inputfilen.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

PDF-eksport med PdfSaveOptions

Brug PdfSaveOptions til finjusteret kontrol over PDF-output. For standardindstillinger er SaveFormat.PDF tilstrækkelig.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Markdown-eksport med MarkdownSaveOptions

MarkdownSaveOptions

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Tekstudtrækning

Udtræk ren tekstindhold fra ethvert indlæst dokument ved hjælp af Document.get_text() uden at skrive til en fil.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Hurtig start

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Understøttede formater

FormatExtensionLæsSkriv
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Open Source & Licensering

Aspose.Words FOSS for Python er udgivet under MIT-licensen. Du kan bruge den i personlige, interne og kommercielle projekter uden licensgebyrer. Kildekoden er tilgængelig på GitHub.


Kom i gang