מבוא

Aspose.Words FOSS for Python מספק API פשוט להמרת מסמכי Word בין פורמטים. המחלקה Document טוענת קבצים בחמישה פורמטים קלט והשיטה save() מייצאת ל-PDF, Markdown, או טקסט פשוט.

פוסט זה מסביר את זרימות העבודה המרכזיות של ההמרה, מהמרה של קובץ יחיד ועד עיבוד אצווה בכל הפורמטים הנתמכים.


תכונות מרכזיות

המרת מסמך יחיד

טען כל קובץ קלט נתמך והמר אותו לפורמט יעד בשתי שורות קוד. הקונסטרוקטור Document מקבל קבצי DOCX, DOC, RTF, TXT, ו‑Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

המרה קבוצתית למספר פורמטים

הפעל save() מספר פעמים על אותו מסמך טעון כדי לייצר פלטים בכל פורמט נתמך מבלי לטעון מחדש את קובץ הקלט.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

ייצוא PDF עם PdfSaveOptions

השתמש בPdfSaveOptions לשליטה מדויקת על פלט PDF. עבור הגדרות ברירת מחדל, SaveFormat.PDF מספיקה.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

ייצוא Markdown עם MarkdownSaveOptions

השתמש בMarkdownSaveOptions לקבלת שליטה נוספת על עיצוב פלט Markdown.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

חילוץ טקסט

חלץ תוכן טקסט פשוט מכל מסמך טעון באמצעות Document.get_text() מבלי לכתוב לקובץ.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

התחלה מהירה

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

פורמטים נתמכים

פורמטסיומתקריאהכתיבה
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

קוד פתוח ורישוי

Aspose.Words FOSS for Python משוחרר תחת רישיון MIT. אתה יכול להשתמש בו בפרויקטים אישיים, פנימיים ומסחריים ללא תשלומי רישיון. קוד המקור זמין ב‑GitHub.


התחלה