Pengenalan
Aspose.Words FOSS for Python menyediakan API yang mudah untuk menukar dokumen Word antara format. Kelas Document memuatkan fail dalam lima format input dan kaedah save() mengeksport ke PDF, Markdown, atau teks biasa.
Pos ini menerangkan aliran kerja penukaran teras, dari penukaran satu fail kepada pemprosesan kumpulan merentasi semua format yang disokong.
Ciri-ciri Utama
Penukaran Dokumen Tunggal
Muatkan mana-mana fail input yang disokong dan tukarkan ke format sasaran dengan dua baris kod. Konstruktor Document menerima fail DOCX, DOC, RTF, TXT, dan Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Penukaran Pukal ke Pelbagai Format
Panggil save() berbilang kali pada dokumen yang sama yang telah dimuatkan untuk menghasilkan output dalam setiap format yang disokong tanpa memuat semula fail input.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Eksport PDF dengan PdfSaveOptions
Gunakan PdfSaveOptions untuk kawalan terperinci ke atas output PDF. Untuk tetapan lalai, SaveFormat.PDF sudah mencukupi.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Eksport Markdown dengan MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Ekstraksi Teks
Ekstrak kandungan teks biasa dari mana-mana dokumen yang dimuatkan menggunakan Document.get_text() tanpa menulis ke fail.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Permulaan Cepat
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Format yang Disokong
| Format | Extension | Baca | Tulis |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Sumber Terbuka & Perlesenan
Aspose.Words FOSS for Python dikeluarkan di bawah MIT License. Anda boleh menggunakannya dalam projek peribadi, dalaman, dan komersial tanpa yuran lesen. Kod sumber tersedia di GitHub.