Introduktion
Aspose.Words FOSS for Python tillhandahåller ett enkelt API för att konvertera Word‑dokument mellan format. Klassen Document laddar filer i fem inmatningsformat och metoden save() exporterar till PDF, Markdown eller vanlig text.
Det här inlägget går igenom de grundläggande konverteringsarbetsflödena, från enstaka filkonvertering till batchbearbetning för alla stödda format.
Nyckelfunktioner
Enkel dokumentkonvertering
Läs in någon stödd indatafil och konvertera den till ett målformat med två kodrader. Document-konstruktorn accepterar DOCX-, DOC-, RTF-, TXT- och Markdown-filer.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Batchkonvertering till flera format
Anropa save() flera gånger på samma inlästa dokument för att producera utdata i alla stödjade format utan att ladda om indatafilen.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PDF‑export med PdfSaveOptions
Använd PdfSaveOptions för finjusterad kontroll över PDF‑utdata. För standardinställningar är SaveFormat.PDF tillräckligt.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Markdown-export med MarkdownSaveOptions
Använd MarkdownSaveOptions för ytterligare kontroll över Markdown‑utdataformat.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Textutdrag
Extrahera ren textinnehåll från vilket som helst laddat dokument med Document.get_text() utan att skriva till en fil.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Snabbstart
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Stödda format
| Format | Filändelse | Läsa | Skriva |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Öppen källkod & licensiering
Aspose.Words FOSS for Python är släppt under MIT-licensen. Du kan använda den i personliga, interna och kommersiella projekt utan licensavgifter. Källkoden är tillgänglig på GitHub.