Введение
Aspose.Words FOSS for Python предоставляет простой API для конвертации документов Word между форматами. Класс Document загружает файлы в пяти входных форматах, а метод save() экспортирует в PDF, Markdown или обычный текст.
В этом посте рассматриваются основные рабочие процессы конвертации, от конвертации отдельного файла до пакетной обработки всех поддерживаемых форматов.
Ключевые особенности
Преобразование одного документа
Загрузите любой поддерживаемый входной файл и преобразуйте его в целевой формат с помощью двух строк кода. Конструктор Document принимает файлы DOCX, DOC, RTF, TXT и Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Пакетное преобразование в несколько форматов
Вызовите save() несколько раз для того же загруженного документа, чтобы получить выводы во всех поддерживаемых форматах без повторной загрузки входного файла.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Экспорт PDF с PdfSaveOptions
Используйте PdfSaveOptions для тонкой настройки вывода PDF. Для настроек по умолчанию достаточно SaveFormat.PDF.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Экспорт Markdown с помощью MarkdownSaveOptions
Используйте MarkdownSaveOptions для дополнительного контроля над форматированием вывода Markdown.
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Извлечение текста
Извлеките простой текстовый контент из любого загруженного документа, используя Document.get_text(), без записи в файл.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Быстрый старт
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Поддерживаемые форматы
| Формат | Расширение | Чтение | Запись |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Открытый исходный код и лицензирование
Aspose.Words FOSS for Python выпущен под лицензией MIT License. Вы можете использовать его в личных, внутренних и коммерческих проектах без лицензионных сборов. Исходный код доступен на GitHub.