Introducció
Aspose.Words FOSS per a Python ofereix una API senzilla per a convertir documents Word entre formats. La classe Document carrega fitxers en cinc formats d’entrada i el mètode save() exporta a PDF, Markdown o text pla.
Aquesta publicació recorre els fluxos de treball principals de conversió, des de la conversió d’un sol fitxer fins al processament per lots en tots els formats compatibles.
Característiques clau
Conversió d’un sol document
Carrega qualsevol fitxer d’entrada compatible i converteix-lo a un format de destinació amb dues línies de codi. El constructor Document accepta fitxers DOCX, DOC, RTF, TXT i Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Conversió per lots a diversos formats
Crida save() diverses vegades al mateix document carregat per generar sortides en tots els formats compatibles sense tornar a carregar el fitxer d’entrada.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Exportació PDF amb PdfSaveOptions
Utilitzeu PdfSaveOptions per a un control detallat sobre la sortida PDF. Per a la configuració per defecte, SaveFormat.PDF és suficient.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Exportació de Markdown amb MarkdownSaveOptions
Utilitzeu MarkdownSaveOptions per a un control addicional sobre el format de sortida Markdown.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Extracció de text
Extreu el contingut de text pla de qualsevol document carregat utilitzant Document.get_text() sense escriure a un fitxer.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Inici ràpid
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Formats compatibles
| Format | Extensió | Lectura | Escriptura |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Codi obert i llicències
Aspose.Words FOSS for Python és publicat sota la MIT License. Podeu utilitzar‑lo en projectes personals, interns i comercials sense tarifes de llicència. El codi font està disponible a GitHub.