Giriş

Aspose.Words FOSS, Word belgeleriyle çalışmak için açık kaynaklı bir Python kütüphanesidir. DOCX, DOC, RTF, TXT ve Markdown dosyalarını okur ve bunları PDF, Markdown veya düz metin olarak dışa aktarabilir — tüm bunlar Microsoft Word veya herhangi bir yerel bağımlılık gerektirmeden.

Kütüphane MIT Lisansı altında yayınlanmıştır ve PyPI’de mevcuttur. Şu şekilde kurun:

pip install aspose-words-foss>=26.4.0

Aspose.Words FOSS, Python 3.10 veya daha yenisini gerektirir ve üç saf Python paketine (olefile, fpdf2, pydantic) bağımlıdır; bu paketler pip tarafından otomatik olarak kurulur.


Ana Özellikler

Belge Yükleme ve Dönüştürme

Document sınıfı birincil giriş noktasıdır. Desteklenen herhangi bir giriş formatında bir dosya yükleyin ve farklı bir çıkış formatına dönüştürmek için save()‘i çağırın.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

PDF Dışa Aktarım

Word belgelerini PDF’ye, varsayılan ayarlar için SaveFormat.PDF veya ince ayarlı kontrol için PdfSaveOptions kullanarak dışa aktar.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Markdown Dışa Aktarma ve Kaydetme Seçenekleri

Çıktı biçimlendirmesi üzerinde ince ayarlı kontrol için MarkdownSaveOptions ve PdfSaveOptions kullanın.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions, PdfSaveOptions

doc = aw.Document("input.docx")

md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Metin Çıkarma

Document.get_text() kullanarak desteklenen herhangi bir belge formatından düz metin çıkarın.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Belge Yapısı Ayrıştırma

Uzmanlaşmış ayrıştırıcılar DOCX iç yapılarından yapılandırılmış verileri çıkarır. NumberingParser liste numaralandırma tanımlarını okur ve StyleParser stil adlarını yapılandırılmış nesnelere ayrıştırır.

Çoklu Biçim Giriş Desteği

Aynı Document yapıcıyı kullanarak beş giriş formatından — DOCX, DOC, RTF, TXT ve Markdown — belgeleri yükleyin. LoadFormat enumu, açık format seçimi için sabitler sağlar (LoadFormat.DOCX, LoadFormat.DOC, LoadFormat.RTF, LoadFormat.TEXT, LoadFormat.MARKDOWN).


Hızlı Başlangıç

Paketi kurun ve bir DOCX dosyasını üç çıkış formatının tamamına dönüştürün:

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("report.docx")

# Export to Markdown
doc.save("report.md", aw.SaveFormat.MARKDOWN)

# Export to PDF
doc.save("report.pdf", aw.SaveFormat.PDF)

# Export to plain text
doc.save("report.txt", aw.SaveFormat.TEXT)

# Extract text directly
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Desteklenen Biçimler

BiçimUzantıOkumaYazma
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Açık Kaynak ve Lisanslama

Aspose.Words FOSS for Python MIT Lisansı altında yayınlanmıştır. Kişisel, dahili ve ticari projelerde lisans ücreti ödemeden özgürce kullanabilirsiniz. Tam kaynak kodu, Aspose Words FOSS organizasyonunda GitHub’da mevcuttur.


Başlarken