Введение

Aspose.Words FOSS for Python предоставляет простой API для конвертации документов Word между форматами. Класс Document загружает файлы в пяти входных форматах, а метод save() экспортирует в PDF, Markdown или обычный текст.

В этом посте рассматриваются основные рабочие процессы конвертации, от конвертации отдельного файла до пакетной обработки всех поддерживаемых форматов.


Ключевые особенности

Преобразование одного документа

Загрузите любой поддерживаемый входной файл и преобразуйте его в целевой формат с помощью двух строк кода. Конструктор Document принимает файлы DOCX, DOC, RTF, TXT и Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Пакетное преобразование в несколько форматов

Вызовите save() несколько раз для того же загруженного документа, чтобы получить выводы во всех поддерживаемых форматах без повторной загрузки входного файла.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Экспорт PDF с PdfSaveOptions

Используйте PdfSaveOptions для тонкой настройки вывода PDF. Для настроек по умолчанию достаточно SaveFormat.PDF.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Экспорт Markdown с помощью MarkdownSaveOptions

Используйте MarkdownSaveOptions для дополнительного контроля над форматированием вывода Markdown.

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Извлечение текста

Извлеките простой текстовый контент из любого загруженного документа, используя Document.get_text(), без записи в файл.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Быстрый старт

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Поддерживаемые форматы

ФорматРасширениеЧтениеЗапись
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Открытый исходный код и лицензирование

Aspose.Words FOSS for Python выпущен под лицензией MIT License. Вы можете использовать его в личных, внутренних и коммерческих проектах без лицензионных сборов. Исходный код доступен на GitHub.


Начало работы