مقدمة
Aspose.Words FOSS هي مكتبة بايثون مفتوحة المصدر للعمل مع مستندات Word. تقرأ ملفات DOCX و DOC و RTF و TXT و Markdown، ويمكنها تصديرها إلى PDF أو Markdown أو نص عادي — كل ذلك دون الحاجة إلى Microsoft Word أو أي تبعيات أصلية.
المكتبة مرخصة بموجب رخصة MIT ومتاحة على PyPI. قم بتثبيتها باستخدام:
pip install aspose-words-foss>=26.4.0
يتطلب Aspose.Words FOSS Python 3.10 أو أحدث ويعتمد على ثلاث حزم بايثون نقية (olefile, fpdf2, pydantic)، يتم تثبيتها تلقائيًا بواسطة pip.
الميزات الرئيسية
تحميل المستند والتحويل
فئة Document هي نقطة الدخول الأساسية. حمّل ملفًا بأي تنسيق مدعوم كإدخال واستدعِ save() لتحويله إلى تنسيق إخراج مختلف.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)
تصدير PDF
تصدير مستندات Word إلى PDF باستخدام SaveFormat.PDF للإعدادات الافتراضية أو PdfSaveOptions للتحكم الدقيق.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
تصدير Markdown مع خيارات الحفظ
استخدم MarkdownSaveOptions و PdfSaveOptions للتحكم الدقيق في تنسيق الإخراج.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions, PdfSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
استخراج النص
استخراج النص العادي من أي تنسيق مستند مدعوم باستخدام Document.get_text().
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
تحليل بنية المستند
المحللات المتخصصة تستخرج البيانات المهيكلة من داخل ملفات DOCX. NumberingParser يقرأ تعريفات ترقيم القوائم و StyleParser يحلل أسماء الأنماط إلى كائنات مهيكلة.
دعم الإدخال متعدد الصيغ
حمّل المستندات من خمسة تنسيقات إدخال — DOCX، DOC، RTF، TXT، وMarkdown — باستخدام المُنشئ Document نفسه. يوفر تعداد LoadFormat ثوابت لاختيار التنسيق صراحةً (LoadFormat.DOCX، LoadFormat.DOC، LoadFormat.RTF، LoadFormat.TEXT، LoadFormat.MARKDOWN).
البدء السريع
قم بتثبيت الحزمة وتحويل ملف DOCX إلى جميع صيغ الإخراج الثلاثة:
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("report.docx")
# Export to Markdown
doc.save("report.md", aw.SaveFormat.MARKDOWN)
# Export to PDF
doc.save("report.pdf", aw.SaveFormat.PDF)
# Export to plain text
doc.save("report.txt", aw.SaveFormat.TEXT)
# Extract text directly
text = doc.get_text()
print(f"Extracted {len(text)} characters")
الصيغ المدعومة
| الصيغة | الامتداد | قراءة | كتابة |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
المصدر المفتوح والترخيص
تم إصدار Aspose.Words FOSS for Python تحت رخصة MIT. يمكنك استخدامه بحرية في المشاريع الشخصية والداخلية والتجارية دون رسوم ترخيص. الكود المصدري الكامل متاح على GitHub في منظمة Aspose Words FOSS.