Вступ

Aspose.Words FOSS for Python забезпечує простий API для конвертування документів Word між форматами. Клас Document завантажує файли у п’яти вхідних форматах, а метод save() експортує у PDF, Markdown або простий текст.

У цьому дописі розглядаються основні робочі процеси конвертації, від конвертації окремих файлів до пакетної обробки всіх підтримуваних форматів.


Ключові особливості

Перетворення одного документа

Завантажте будь‑який підтримуваний вхідний файл і конвертуйте його у цільовий формат за допомогою двох рядків коду. Конструктор Document приймає файли DOCX, DOC, RTF, TXT та Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Пакетне перетворення у кілька форматів

Викликайте save() кілька разів на одному завантаженому документі, щоб отримати результати у всіх підтримуваних форматах без повторного завантаження вхідного файлу.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Експорт PDF з PdfSaveOptions

Використовуйте PdfSaveOptions для детального керування виводом PDF. Для типових налаштувань достатньо SaveFormat.PDF.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Експорт у Markdown за допомогою MarkdownSaveOptions

MarkdownSaveOptions

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Видобування тексту

Витягніть вміст простого тексту з будь-якого завантаженого документа за допомогою Document.get_text() без запису у файл.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Швидкий старт

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Підтримувані формати

ФорматРозширенняЧитанняЗапис
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Відкритий код та ліцензування

Aspose.Words FOSS for Python випущено під ліцензією MIT License. Ви можете використовувати його в особистих, внутрішніх та комерційних проектах без ліцензійних зборів. Вихідний код доступний на GitHub.


Початок роботи