Pendahuluan

Aspose.Words FOSS for Python menyediakan API yang sederhana untuk mengonversi dokumen Word antar format. Kelas Document memuat file dalam lima format input dan metode save() mengekspor ke PDF, Markdown, atau teks biasa.

Postingan ini menjelaskan alur kerja konversi inti, mulai dari konversi satu file hingga pemrosesan batch di semua format yang didukung.


Fitur Utama

Konversi Dokumen Tunggal

Muat file input yang didukung apa pun dan konversi ke format target dengan dua baris kode. Konstruktor Document menerima file DOCX, DOC, RTF, TXT, dan Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Konversi Batch ke Berbagai Format

Panggil save() beberapa kali pada dokumen yang sama yang telah dimuat untuk menghasilkan output dalam setiap format yang didukung tanpa memuat ulang file input.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Ekspor PDF dengan PdfSaveOptions

Gunakan PdfSaveOptions untuk kontrol halus atas output PDF. Untuk pengaturan default, SaveFormat.PDF sudah cukup.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Ekspor Markdown dengan MarkdownSaveOptions

MarkdownSaveOptions

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Ekstraksi Teks

Ekstrak konten teks biasa dari dokumen apa pun yang dimuat menggunakan Document.get_text() tanpa menulis ke file.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Panduan Cepat

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Format yang Didukung

FormatEkstensiBacaTulis
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Sumber Terbuka & Lisensi

Aspose.Words FOSS untuk Python dirilis di bawah MIT License. Anda dapat menggunakannya dalam proyek pribadi, internal, dan komersial tanpa biaya lisensi. Kode sumber tersedia di GitHub.


Memulai