מבוא
Aspose.Words FOSS for Python מספק API פשוט להמרת מסמכי Word בין פורמטים. המחלקה Document טוענת קבצים בחמישה פורמטים קלט והשיטה save() מייצאת ל-PDF, Markdown, או טקסט פשוט.
פוסט זה מסביר את זרימות העבודה המרכזיות של ההמרה, מהמרה של קובץ יחיד ועד עיבוד אצווה בכל הפורמטים הנתמכים.
תכונות מרכזיות
המרת מסמך יחיד
טען כל קובץ קלט נתמך והמר אותו לפורמט יעד בשתי שורות קוד. הקונסטרוקטור Document מקבל קבצי DOCX, DOC, RTF, TXT, ו‑Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
המרה קבוצתית למספר פורמטים
הפעל save() מספר פעמים על אותו מסמך טעון כדי לייצר פלטים בכל פורמט נתמך מבלי לטעון מחדש את קובץ הקלט.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
ייצוא PDF עם PdfSaveOptions
השתמש בPdfSaveOptions לשליטה מדויקת על פלט PDF. עבור הגדרות ברירת מחדל, SaveFormat.PDF מספיקה.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
ייצוא Markdown עם MarkdownSaveOptions
השתמש בMarkdownSaveOptions לקבלת שליטה נוספת על עיצוב פלט Markdown.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
חילוץ טקסט
חלץ תוכן טקסט פשוט מכל מסמך טעון באמצעות Document.get_text() מבלי לכתוב לקובץ.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
התחלה מהירה
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
פורמטים נתמכים
| פורמט | סיומת | קריאה | כתיבה |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
קוד פתוח ורישוי
Aspose.Words FOSS for Python משוחרר תחת רישיון MIT. אתה יכול להשתמש בו בפרויקטים אישיים, פנימיים ומסחריים ללא תשלומי רישיון. קוד המקור זמין ב‑GitHub.