Ievads
Aspose.Words FOSS for Python nodrošina vienkāršu API, lai konvertētu Word dokumentus starp formātiem. Document klase ielādē failus piecos ievades formātos, un save() metode eksportē uz PDF, Markdown vai plain text.
Šis ieraksts izskaidro galvenās konvertēšanas darbplūsmas, sākot no vienas faila konvertēšanas līdz grupas apstrādei visos atbalstītajos formātos.
Galvenās funkcijas
Viena dokumenta konvertēšana
Ielādējiet jebkuru atbalstītu ievades failu un konvertējiet to uz mērķa formātu ar divām koda rindām. Document konstruktoram pieņem DOCX, DOC, RTF, TXT un Markdown failus.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Masveida konvertēšana uz vairākām formātām
Izsauciet save() vairākas reizes tajā pašā ielādētajā dokumentā, lai radītu izvades visos atbalstītajos formātos, nepārlādējot ievades failu.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
PDF eksportēšana ar PdfSaveOptions
Izmantojiet PdfSaveOptions, lai veiktu smalku vadību pār PDF izvadi. Noklusējuma iestatījumiem SaveFormat.PDF ir pietiekami.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Markdown eksportēšana ar MarkdownSaveOptions
Izmantojiet MarkdownSaveOptions, lai iegūtu papildu kontroli pār Markdown izvades formatēšanu.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Teksta izguve
Izgūstiet vienkārša teksta saturu no jebkura ielādēta dokumenta, izmantojot Document.get_text(), nepārrakstot failu.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Ātrais sākums
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Atbalstītie formāti
| Formāts | Paplašinājums | Lasīt | Rakstīt |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Atvērtā pirmkods un licencēšana
Aspose.Words FOSS for Python ir izlaists zem MIT License. To var izmantot personīgajos, iekšējos un komerciālos projektos bez licences maksas. Avota kods ir pieejams GitHub.