Introducció

Aspose.Words FOSS per a Python ofereix una API senzilla per a convertir documents Word entre formats. La classe Document carrega fitxers en cinc formats d’entrada i el mètode save() exporta a PDF, Markdown o text pla.

Aquesta publicació recorre els fluxos de treball principals de conversió, des de la conversió d’un sol fitxer fins al processament per lots en tots els formats compatibles.


Característiques clau

Conversió d’un sol document

Carrega qualsevol fitxer d’entrada compatible i converteix-lo a un format de destinació amb dues línies de codi. El constructor Document accepta fitxers DOCX, DOC, RTF, TXT i Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Conversió per lots a diversos formats

Crida save() diverses vegades al mateix document carregat per generar sortides en tots els formats compatibles sense tornar a carregar el fitxer d’entrada.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Exportació PDF amb PdfSaveOptions

Utilitzeu PdfSaveOptions per a un control detallat sobre la sortida PDF. Per a la configuració per defecte, SaveFormat.PDF és suficient.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Exportació de Markdown amb MarkdownSaveOptions

Utilitzeu MarkdownSaveOptions per a un control addicional sobre el format de sortida Markdown.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Extracció de text

Extreu el contingut de text pla de qualsevol document carregat utilitzant Document.get_text() sense escriure a un fitxer.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Inici ràpid

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Formats compatibles

FormatExtensióLecturaEscriptura
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Codi obert i llicències

Aspose.Words FOSS for Python és publicat sota la MIT License. Podeu utilitzar‑lo en projectes personals, interns i comercials sense tarifes de llicència. El codi font està disponible a GitHub.


Començar