Pengenalan

Aspose.Words FOSS for Python menyediakan API yang mudah untuk menukar dokumen Word antara format. Kelas Document memuatkan fail dalam lima format input dan kaedah save() mengeksport ke PDF, Markdown, atau teks biasa.

Pos ini menerangkan aliran kerja penukaran teras, dari penukaran satu fail kepada pemprosesan kumpulan merentasi semua format yang disokong.


Ciri-ciri Utama

Penukaran Dokumen Tunggal

Muatkan mana-mana fail input yang disokong dan tukarkan ke format sasaran dengan dua baris kod. Konstruktor Document menerima fail DOCX, DOC, RTF, TXT, dan Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Penukaran Pukal ke Pelbagai Format

Panggil save() berbilang kali pada dokumen yang sama yang telah dimuatkan untuk menghasilkan output dalam setiap format yang disokong tanpa memuat semula fail input.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Eksport PDF dengan PdfSaveOptions

Gunakan PdfSaveOptions untuk kawalan terperinci ke atas output PDF. Untuk tetapan lalai, SaveFormat.PDF sudah mencukupi.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Eksport Markdown dengan MarkdownSaveOptions

MarkdownSaveOptions

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Ekstraksi Teks

Ekstrak kandungan teks biasa dari mana-mana dokumen yang dimuatkan menggunakan Document.get_text() tanpa menulis ke fail.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Permulaan Cepat

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Format yang Disokong

FormatExtensionBacaTulis
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Sumber Terbuka & Perlesenan

Aspose.Words FOSS for Python dikeluarkan di bawah MIT License. Anda boleh menggunakannya dalam projek peribadi, dalaman, dan komersial tanpa yuran lesen. Kod sumber tersedia di GitHub.


Mula Menggunakan