מבוא

Aspose.Words FOSS היא ספרייה פתוחה של פייתון לעבודה עם מסמכי Word. היא קוראת קבצי DOCX, DOC, RTF, TXT ו‑Markdown, ויכולה לייצא אותם ל‑PDF, Markdown או טקסט פשוט — כל זאת ללא צורך ב‑Microsoft Word או בתלויות מקומיות.

הספרייה משוחררת תחת רישיון MIT וזמינה ב‑PyPI. התקן אותה באמצעות:

pip install aspose-words-foss>=26.4.0

Aspose.Words FOSS דורש Python 3.10 או גרסה מאוחרת יותר ותלוי בשלושה חבילות pure-Python (olefile, fpdf2, pydantic), המותקנות אוטומטית על ידי pip.


תכונות מרכזיות

טעינת מסמכים והמרה

המחלקה Document היא נקודת הכניסה הראשית. טען קובץ בכל פורמט קלט נתמך וקרא ל-save() כדי להמיר אותו לפורמט פלט שונה.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

PDF ייצוא

ייצא מסמכי Word ל‑PDF באמצעות SaveFormat.PDF להגדרות ברירת מחדל או PdfSaveOptions לבקרה מדויקת.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

ייצוא Markdown עם אפשרויות שמירה

השתמש בMarkdownSaveOptions ובPdfSaveOptions לשליטה מדויקת על עיצוב הפלט.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions, PdfSaveOptions

doc = aw.Document("input.docx")

md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

חילוץ טקסט

חלץ טקסט פשוט מכל פורמט מסמך נתמך באמצעות Document.get_text().

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

ניתוח מבנה המסמך

מפענחים מתמחים מחלצים נתונים מובנים מתוך הפנים של DOCX. NumberingParser קורא הגדרות מספור רשימות ו-StyleParser מפענח שמות סגנון לאובייקטים מובנים.

תמיכה בקלט מרובה פורמטים

טען מסמכים מחמישה פורמטים קלט — DOCX, DOC, RTF, TXT, ו‑Markdown — באמצעות הבונה Document זהה. המונה LoadFormat מספק קבועים לבחירת פורמט מפורשת (LoadFormat.DOCX, LoadFormat.DOC, LoadFormat.RTF, LoadFormat.TEXT, LoadFormat.MARKDOWN).


התחלה מהירה

התקן את החבילה והמר קובץ DOCX לכל שלושת פורמטי הפלט:

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("report.docx")

# Export to Markdown
doc.save("report.md", aw.SaveFormat.MARKDOWN)

# Export to PDF
doc.save("report.pdf", aw.SaveFormat.PDF)

# Export to plain text
doc.save("report.txt", aw.SaveFormat.TEXT)

# Extract text directly
text = doc.get_text()
print(f"Extracted {len(text)} characters")

פורמטים נתמכים

פורמטהרחבהקריאהכתיבה
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

קוד פתוח ורישוי

Aspose.Words FOSS for Python משוחרר תחת רישיון MIT. אתה יכול להשתמש בו בחופשיות בפרויקטים אישיים, פנימיים ומסחריים ללא תשלומי רישיון. קוד המקור המלא זמין ב‑GitHub בארגון Aspose Words FOSS.


התחלה