Εισαγωγή
Το Aspose.Words FOSS for Python παρέχει ένα απλό API για τη μετατροπή εγγράφων Word μεταξύ μορφών. Η κλάση Document φορτώνει αρχεία σε πέντε μορφές εισόδου και η μέθοδος save() εξάγει σε PDF, Markdown ή απλό κείμενο.
Αυτή η ανάρτηση περιγράφει τις βασικές ροές εργασίας μετατροπής, από τη μετατροπή ενός μόνο αρχείου έως την επεξεργασία σε παρτίδες σε όλες τις υποστηριζόμενες μορφές.
Βασικά χαρακτηριστικά
Μετατροπή Ενός Εγγράφου
Φορτώστε οποιοδήποτε υποστηριζόμενο αρχείο εισόδου και μετατρέψτε το σε μορφή-στόχο με δύο γραμμές κώδικα. Ο κατασκευαστής Document δέχεται αρχεία DOCX, DOC, RTF, TXT και Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Μαζική μετατροπή σε πολλαπλές μορφές
Καλέστε save() πολλές φορές στο ίδιο φορτωμένο έγγραφο για να παράγετε εξόδους σε κάθε υποστηριζόμενη μορφή χωρίς να φορτώνετε ξανά το αρχείο εισόδου.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Εξαγωγή PDF με PdfSaveOptions
Χρησιμοποιήστε PdfSaveOptions για λεπτομερή έλεγχο της εξόδου PDF. Για τις προεπιλεγμένες ρυθμίσεις, το SaveFormat.PDF είναι επαρκές.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Εξαγωγή Markdown με MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Εξαγωγή κειμένου
Εξάγετε το απλό κείμενο από οποιοδήποτε φορτωμένο έγγραφο χρησιμοποιώντας Document.get_text() χωρίς να γράψετε σε αρχείο.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Γρήγορη εκκίνηση
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Υποστηριζόμενες μορφές
| Μορφή | Επέκταση | Ανάγνωση | Εγγραφή |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Ανοιχτού Κώδικα & Αδειοδότηση
Aspose.Words FOSS for Python κυκλοφορεί υπό την άδεια MIT. Μπορείτε να το χρησιμοποιήσετε σε προσωπικά, εσωτερικά και εμπορικά έργα χωρίς χρεώσεις αδειών. Ο κώδικας πηγής είναι διαθέσιμος στο GitHub.