Въведение

Aspose.Words FOSS for Python предоставя прост API за конвертиране на Word документи между формати. Класът Document зарежда файлове в пет входни формата, а методът save() експортира към PDF, Markdown или обикновен текст.

Тази публикация разглежда основните работни процеси за конвертиране, от конвертиране на един файл до пакетна обработка за всички поддържани формати.


Ключови функции

Конвертиране на един документ

Заредете всеки поддържан входен файл и го конвертирайте в целеви формат с два реда код. Конструкторът Document приема файлове DOCX, DOC, RTF, TXT и Markdown.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Пакетно конвертиране в множество формати

Извикайте save() многократно върху един и същи зареден документ, за да генерирате изходи във всички поддържани формати, без да презареждате входния файл.

import aspose.words_foss as aw

doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)

Експорт на PDF с PdfSaveOptions

Използвайте PdfSaveOptions за прецизен контрол върху PDF изхода. За настройките по подразбиране, SaveFormat.PDF е достатъчен.

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)

Експорт в Markdown с MarkdownSaveOptions

MarkdownSaveOptions

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)

Извличане на текст

Извлечете чист текстовото съдържание от всеки зареден документ, използвайки Document.get_text(), без да записвате във файл.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")

Бърз старт

pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw

# Load a Word document
doc = aw.Document("contract.docx")

# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)

# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")

Поддържани формати

ФорматРазширениеЧетенеПисане
DOCX.docx
DOC.doc
RTF.rtf
TXT.txt
Markdown.md
PDF.pdf

Отворен код и лицензиране

Aspose.Words FOSS for Python е публикуван под MIT License. Можете да го използвате в лични, вътрешни и комерсиални проекти без такси за лиценз. Изходният код е достъпен в GitHub.


Започване