Giriş
Aspose.Words FOSS, Word belgeleriyle çalışmak için açık kaynaklı bir Python kütüphanesidir. DOCX, DOC, RTF, TXT ve Markdown dosyalarını okur ve bunları PDF, Markdown veya düz metin olarak dışa aktarabilir — tüm bunlar Microsoft Word veya herhangi bir yerel bağımlılık gerektirmeden.
Kütüphane MIT Lisansı altında yayınlanmıştır ve PyPI’de mevcuttur. Şu şekilde kurun:
pip install aspose-words-foss>=26.4.0
Aspose.Words FOSS, Python 3.10 veya daha yenisini gerektirir ve üç saf Python paketine (olefile, fpdf2, pydantic) bağımlıdır; bu paketler pip tarafından otomatik olarak kurulur.
Ana Özellikler
Belge Yükleme ve Dönüştürme
Document sınıfı birincil giriş noktasıdır. Desteklenen herhangi bir giriş formatında bir dosya yükleyin ve farklı bir çıkış formatına dönüştürmek için save()‘i çağırın.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)
PDF Dışa Aktarım
Word belgelerini PDF’ye, varsayılan ayarlar için SaveFormat.PDF veya ince ayarlı kontrol için PdfSaveOptions kullanarak dışa aktar.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Markdown Dışa Aktarma ve Kaydetme Seçenekleri
Çıktı biçimlendirmesi üzerinde ince ayarlı kontrol için MarkdownSaveOptions ve PdfSaveOptions kullanın.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions, PdfSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Metin Çıkarma
Document.get_text() kullanarak desteklenen herhangi bir belge formatından düz metin çıkarın.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
Belge Yapısı Ayrıştırma
Uzmanlaşmış ayrıştırıcılar DOCX iç yapılarından yapılandırılmış verileri çıkarır. NumberingParser liste numaralandırma tanımlarını okur ve StyleParser stil adlarını yapılandırılmış nesnelere ayrıştırır.
Çoklu Biçim Giriş Desteği
Aynı Document yapıcıyı kullanarak beş giriş formatından — DOCX, DOC, RTF, TXT ve Markdown — belgeleri yükleyin. LoadFormat enumu, açık format seçimi için sabitler sağlar (LoadFormat.DOCX, LoadFormat.DOC, LoadFormat.RTF, LoadFormat.TEXT, LoadFormat.MARKDOWN).
Hızlı Başlangıç
Paketi kurun ve bir DOCX dosyasını üç çıkış formatının tamamına dönüştürün:
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("report.docx")
# Export to Markdown
doc.save("report.md", aw.SaveFormat.MARKDOWN)
# Export to PDF
doc.save("report.pdf", aw.SaveFormat.PDF)
# Export to plain text
doc.save("report.txt", aw.SaveFormat.TEXT)
# Extract text directly
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Desteklenen Biçimler
| Biçim | Uzantı | Okuma | Yazma |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Açık Kaynak ve Lisanslama
Aspose.Words FOSS for Python MIT Lisansı altında yayınlanmıştır. Kişisel, dahili ve ticari projelerde lisans ücreti ödemeden özgürce kullanabilirsiniz. Tam kaynak kodu, Aspose Words FOSS organizasyonunda GitHub’da mevcuttur.