Introduktion
Aspose.Words FOSS for Python leverer en ligetil API til at konvertere Word-dokumenter mellem formater. Document-klassen indlæser filer i fem inputformater, og save()-metoden eksporterer til PDF, Markdown eller almindelig tekst.
Dette indlæg gennemgår de grundlæggende konverteringsarbejdsgange, fra enkeltfilkonvertering til batchbehandling på tværs af alle understøttede formater.
Nøglefunktioner
Enkelt dokumentkonvertering
Indlæs en hvilken som helst understøttet inputfil og konverter den til et målformat med to linjer kode. Document-konstruktøren accepterer DOCX, DOC, RTF, TXT og Markdown-filer.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Batchkonvertering til flere formater
Kald save() flere gange på det samme indlæste dokument for at producere output i alle understøttede formater uden at genindlæse inputfilen.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PDF-eksport med PdfSaveOptions
Brug PdfSaveOptions til finjusteret kontrol over PDF-output. For standardindstillinger er SaveFormat.PDF tilstrækkelig.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Markdown-eksport med MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Tekstudtrækning
Udtræk ren tekstindhold fra ethvert indlæst dokument ved hjælp af Document.get_text() uden at skrive til en fil.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Hurtig start
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Understøttede formater
| Format | Extension | Læs | Skriv |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Open Source & Licensering
Aspose.Words FOSS for Python er udgivet under MIT-licensen. Du kan bruge den i personlige, interne og kommercielle projekter uden licensgebyrer. Kildekoden er tilgængelig på GitHub.