Въведение
Aspose.Words FOSS for Python предоставя прост API за конвертиране на Word документи между формати. Класът Document зарежда файлове в пет входни формата, а методът save() експортира към PDF, Markdown или обикновен текст.
Тази публикация разглежда основните работни процеси за конвертиране, от конвертиране на един файл до пакетна обработка за всички поддържани формати.
Ключови функции
Конвертиране на един документ
Заредете всеки поддържан входен файл и го конвертирайте в целеви формат с два реда код. Конструкторът Document приема файлове DOCX, DOC, RTF, TXT и Markdown.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)
Пакетно конвертиране в множество формати
Извикайте save() многократно върху един и същи зареден документ, за да генерирате изходи във всички поддържани формати, без да презареждате входния файл.
import aspose.words_foss as aw
doc = aw.Document("report.docx")
doc.save("report.md", aw.SaveFormat.MARKDOWN)
doc.save("report.pdf", aw.SaveFormat.PDF)
doc.save("report.txt", aw.SaveFormat.TEXT)
Експорт на PDF с PdfSaveOptions
Използвайте PdfSaveOptions за прецизен контрол върху PDF изхода. За настройките по подразбиране, SaveFormat.PDF е достатъчен.
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
pdf_opts = PdfSaveOptions()
doc.save("output.pdf", pdf_opts)
Експорт в Markdown с MarkdownSaveOptions
MarkdownSaveOptions
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
md_opts = MarkdownSaveOptions()
doc.save("output.md", md_opts)
Извличане на текст
Извлечете чист текстовото съдържание от всеки зареден документ, използвайки Document.get_text(), без да записвате във файл.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()
print(f"Extracted {len(text)} characters")
Бърз старт
pip install aspose-words-foss>=26.4.0
import aspose.words_foss as aw
# Load a Word document
doc = aw.Document("contract.docx")
# Convert to all output formats
doc.save("contract.md", aw.SaveFormat.MARKDOWN)
doc.save("contract.pdf", aw.SaveFormat.PDF)
doc.save("contract.txt", aw.SaveFormat.TEXT)
# Extract text for processing
text = doc.get_text()
print(f"Document contains {len(text)} characters")
Поддържани формати
| Формат | Разширение | Четене | Писане |
|---|---|---|---|
| DOCX | .docx | ✓ | — |
| DOC | .doc | ✓ | — |
| RTF | .rtf | ✓ | — |
| TXT | .txt | ✓ | — |
| Markdown | .md | ✓ | ✓ |
| — | ✓ |
Отворен код и лицензиране
Aspose.Words FOSS for Python е публикуван под MIT License. Можете да го използвате в лични, вътрешни и комерсиални проекти без такси за лиценз. Изходният код е достъпен в GitHub.