Вступ
Aspose.Words FOSS for Python забезпечує простий API для конвертування документів Word між форматами. Клас Document завантажує файли у п’яти вхідних форматах, а метод save() експортує у PDF, Markdown або простий текст.
У цьому дописі розглядаються основні робочі процеси конвертації, від конвертації окремих файлів до пакетної обробки всіх підтримуваних форматів.
Ключові особливості
Перетворення одного документа
Завантажте будь‑який підтримуваний вхідний файл і конвертуйте його у цільовий формат за допомогою двох рядків коду. Конструктор Document приймає файли DOCX, DOC, RTF, TXT та Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Пакетне перетворення у кілька форматів
Викликайте save() кілька разів на одному завантаженому документі, щоб отримати результати у всіх підтримуваних форматах без повторного завантаження вхідного файлу.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Експорт PDF з PdfSaveOptions
Використовуйте PdfSaveOptions для детального керування виводом PDF. Для типових налаштувань достатньо SaveFormat.PDF.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Експорт у Markdown за допомогою MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Видобування тексту
Витягніть вміст простого тексту з будь-якого завантаженого документа за допомогою Document.get_text() без запису у файл.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Швидкий старт
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Підтримувані формати
| Формат | Розширення | Читання | Запис |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Відкритий код та ліцензування
Aspose.Words FOSS for Python випущено під ліцензією MIT License. Ви можете використовувати його в особистих, внутрішніх та комерційних проектах без ліцензійних зборів. Вихідний код доступний на GitHub.